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摘 要 多 模 态 数据 为 实现 对 认 知 结构 的 精准 诊断 及 其 他 认 知 特征 (如 ， 认 知 风 格 ) 的 全 面 反馈 提供 了 可 能 性 。 为 实 
现 对 题目 作答 精度 、 作 答 时 间 (RT) 和 视觉 注视 点 数 (EC) 的 联合 分 析 , 本 文 基 于 联合 -交叉 负载 建 模 法 提出 3 个 多 模 
态 认 知 诊断 模型 。 实 证 研究 及 模拟 研究 结果 表明 : (1) 联 合 分 析 比 分 离 分 析 更 适用 于 多 模 态 数据 ; (2) 新 模型 可 直接 利 
用 RT 和 FC 中 信息 提高 潜在 能 力 或 潜在 属性 的 佑 计 准 确 性 ; (3) 新 模型 的 参数 估计 返 真性 较 好 ; (4) 忽 略 交 又 负 载 所 


导致 的 负面 结果 比 元 余 考 虑 交叉 负载 所 导致 的 更 严重 。 
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1 引言 


个 体 的 外 显 行为 (如 ,学 习 行 为 或 问题 解决 行 
为 ) 是 由 相互 关联 的 多 种 认 知 过 程 及 心理 建构 所 共 
同 决定 的 。 因 此 , 在 特定 问题 (任务 ) 情 境 下 ， 对 问题 
解决 行为 的 合理 分 析 不 仅 可 以 挖 气 个 体 的 认 知 结 
构 ， 还 能 反映 个 体 的 认 知 风格 或 认 知 流畅 性 等 其 他 
认 知 特征 。 认 知 风格 是 个 体 组 织 和 处 理 信息 的 特征 
及 相对 稳定 的 方式 , 反映 了 个 体 在 感知 、 记 忆 、 思 
维 、 判 断 和 解决 问题 等 方面 的 偏好 或 典型 模式 
(Riding, 1997)， 有 助 于 调 市 认 知 加 工 过 程 的 持续 时 
间 、 强 度 、 范 围 和 速度 (Gardner et al., 1959; Messick, 
1989)。 比如 ,根据 个 体 加 工 信 息 或 解决 问题 的 速度 
和 精度 ， 可 将 个 体 分 为 沉思 型 或 冲动 型 (Kagan, 1965); 
通常 ,沉思 型 个 体 反 应 速度 较 慢 但 精度 较 高 ， 而 冲 
动 型 个 体 反 应 速度 较 快 但 容易 发 生 错 误 。 再 比如 ， 
根据 个 体 注 意 力 的 广度 和 专注 度 ,， 可 将 个 体 分 为 扫 
描 者 和 聚焦 者 (Gardner et al., 1959)。 在 解决 问题 时 ， 
扫描 考 的 注意 力 广 度 宽 但 专注 度 低 ， 而 聚焦 者 的 注 
意 力 广度 罕 但 专注 度 高 。 有 人 研究 表明 在 解决 问题 时 
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扫描 者 的 精度 高 于 聚焦 者 的 (Gardner et al., 1959; 
Holzman, 1966); 另 有 研究 指出 聚焦 者 对 目标 的 注意 
力 持 续 时 间 久 于 扫描 者 (Rimawi et al., 2020)。 也 有 
研究 认为 扫描 和 聚焦 是 两 种 可 分 离 的 风格 (Messick,， 
1989), 根据 扫描 范围 ( 即 注 意 力 广度 ) 可 将 个 体 分 为 
罕 扫 描 者 和 宽 扫 描 者 ,根据 聚焦 程度 ( 即 专注 度 ) 可 
将 个 体 分 为 聚焦 者 和 非 聚 焦 者 ; mH., 两 种 风格 还 
能 相互 组 合 。 与 具有 相对 稳定 性 的 认 知 风格 不 同 ， 
认 知 流畅 性 通常 是 指 个 体 对 信息 处 理 或 解决 问题 
的 难 易 程度 的 主观 体验 (Unkelbach，2006), 流畅 性 
可 能 会 随 所 处 理 的 信息 、 所 解决 的 问题 或 所 属 的 领 
域 的 不 同 而 不 同 (Biancarosa & Shanley, 2015). 通常 ， 
在 有 关 流 畅 性 测量 的 研究 中 ,流畅 性 被 视 为 一 种 速 
度 和 精度 的 综合 反映 。 已 有 研究 表明 达到 流畅 性 水 
平 的 个 体 可 以 又 快 又 好 地 解决 问题 (Wang & Chen, 
2020)。 总 之 , 为 实现 对 个 体 学 习 现 状 的 全 面 反 馈 ， 
对 个 体 问 题解 决 行为 的 分 析 应 尝试 从 多 视角 切入 ， 
不 仅 提 供 可 反映 认 知 结构 的 , 还 要 提供 可 反映 认 知 
风格 或 认 知 流畅 性 等 其 他 认 知 特征 的 反馈 信息 。 

近 些 年 ， 以 促进 个 体 学 习 为 目的 ， 客观 量化 个 
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体 学 习 现 状 并 提供 诊断 反馈 的 测评 模式 日 益 受 到 
关注 。 其 中 ， 认 知 诊断 作为 一 种 有 代表 性 的 诊断 测 
评 方式 ， 主 要 功能 是 诊断 个 体 的 学 习 现 状 ( 如 ， 知 
识 掌 握 程度 ) 并 提供 相应 的 反馈 ， 为 促进 个 体 学 习 
提供 了 方法 学 文 持 (Ren et ab, 2021; Tang & Zhan, 
2021; EYA 等 , 2020)。 作 为 认 知 诊断 的 核心 技术 
环节 之 一 ， 认 知 诊断 模型 (Cognitive diagnosis model, 
CDM) 或 诊断 分 类 模型 的 合理 性 影响 着 诊断 结果 的 
准确 性 、 有 效 性 和 可 解释 性 。CDM 作为 一 种 有 约 
束 的 潜在 类 别 模型 ,描述 了 潜在 属性 和 外 显 题目 作 
答 行 为 之 间 概 率 关 系 。 通 党 ,潜在 属性 为 类 别 变量 
(如 ,“0” 表 示 “ 未 掌握”,“1” 表 示 “ 掌 握 ”)， 是 根据 个 
体 完成 复杂 学 习 任 务 或 解决 复杂 问题 时 所 需 具 备 
的 潜在 技能 或 知识 来 确定 的 。 目 前 ,针对 不 同 的 测 
验 情 境 和 理论 假设 , 已 有 许多 CDM 被 提出 (Rupp 
et al., 2010; von Davier & Lee, 2019)， 比 如 和 常见 的 
DINA 模型 (Junker & Sijtsma, 2001) 及 其 一 般 化 模型 
(de la Torre, 2011). 然而 ,， 绝 大 多 数 CDM 是 基于 题 
日 作答 精度 (response accuracy，RA) 这 种 单一 且 传 
统 的 数据 源 开发 的 ( 詹 沛 达 ，2018)， 导 致 它们 所 提 
供 的 诊断 反 包 范围 有 限 : 仅 关 注 对 问题 解决 所 需 的 
认 知 技能 或 学 科 知 识 的 诊断 ， 仪 能 提供 可 反映 认 知 
结构 的 反馈 信息 ; 忽略 问题 解决 时 的 信息 加 工 速度 
和 专注 力 (或 视觉 参与 度 ) 等 其 他 相关 建构 ,难以 提 
供 可 反映 认 知 风格 或 认 知 流畅 性 等 其 他 认 知 特征 
Writ. mami, 目前 绝 大 多 数 CDM 提供 
的 反馈 信息 有 限 ， 不 能 全 面 反映 个 体 间 学 习 现 状 之 
间 的 差异 ,进而 可 能 限制 有 针对 性 干预 的 效果 。 导 
致 这 种 局 限 性 的 可 能 原因 之 一 是 在 传统 的 (基于 纸 
笔 测验 的 ) 认 知 诊断 测评 中 很 难 采集 到 诸如 题目 作 
答 时 间 (response time, RT) 等 数据 。 

近 些 年 ， 随 着 计算 机 (网 络 ) 化 测验 的 普及 ， 对 
过 程 数据 的 采集 已 趋 于 和 常态 化 。 过程 数 据 是 指 由 计 
算 机 记录 的 反映 个 体 问 题解 决 过 程 的 含有 时 间 惟 
的 行为 序列 数据 (Zhan & Qiao, 2022; Zoanetti, 2010; 
李 美 娟 等 , 2020; ХПИ: 等 , 2022)。 对 过 程 数 据 的 
分 析 不 仅 可 以 挖掘 个 体 的 问题 解决 策略 (Qiao & 
Jiao, 2018), 还 可 以 探究 个 体 的 问题 解决 能 力 (Liu 
et al., 2018; Zhan & Qiao, 2022). 目前 , RT 数据 作为 

-种 有 代表 性 的 过 程 数据 ， 因 为 其 具有 标准 化 数据 
结构 ， 符 合 心理 计量 模型 的 建 模 与 分 析 要 求 ， 得 


”标准 化 数据 结构 是 指数 据 具 有 Nx7 的 矩阵 结构 ， 其 中 УЖ 
被 试 总 数 ,7 表示 题目 总 数 。 
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到 了 人 研究 者 们 的 高 度 关注 。 已 有 人 研究 表明 , RT 数据 
作为 传统 RA 数据 的 补充 , 不 仅 能 够 提供 个 体 在 问 
题解 决 过 程 中 的 加 工 速 度 信息 ,还 可 以 提高 对 潜在 
能 力 的 估计 精度 (Bolsiova & Tijmstra, 2018; fili 
达 ，2019) 和 潜在 属性 的 分 类 准确 性 (Zhan, Лао, & 
Liao，2018)。 实 际 上 , 计算 机 化 测验 的 自动 化 特性 
使 得 它 能 够 在 个 体 解 决 问题 过 程 中 实时 记录 不 限 
于 过 程 数 据 的 多 种 类 型 数据 ， 即 多 模 态 数据 。 多 模 
态 数据 是 指 对 于 同一 个 描述 对 象 , 通过 多 种 仪 絮 、 
测量 设备 或 采集 仪器 获得 到 的 互补 的 多 样 性 数据 
(Lahat et al., 201$)。 比 如 ， 除 结果 数据 (如 , RA 数据 ) 
和 过 程 数据 (如 ，RT 数据 ) 外 ,通过 瞬 入 式 传 感 器 或 
实验 设备 (如 ， 眼 动 仪 )， 计 算 机 化 测验 还 可 以 同步 
记录 诸如 眼 动 、 喘 体 运 动 及 神经 活动 等 生物 计量 数 
据 。 生 物 计量 数据 可 用 于 提供 有 关 个 体 与 任务 情境 
互动 效果 的 反馈 。 比如 ,解决 问题 时 个 体 的 视觉 参 
与 度 (Man & Harring, 2019; Zhan et al., 2022) 或 大 脑 
激活 水 平 (Jeon et al., 2021). 在 技术 增强 测评 环境 中 ， 
随 着 多 模 态 数据 采集 技术 的 不 断 发 展 ， 针 对 多 模 态 
数据 的 联合 分 析 技 术 也 应 得 到 相应 的 关注 和 发 展 。 
但 是 ,多 模 态 数据 的 分 析 也 给 心理 计量 模型 带 
来 了 挑战 : 仅 凭 借 单 一 的 测量 模型 无 法 满足 分 析 多 
模 态 数据 的 需求 。 因 此 ,在 智能 时 代 背 景 下 ， 基 于 
技术 增强 测评 环境 ， 建 立 心 理 与 教育 测量 新 范式 ， 
探究 多 模 态 数据 分 析 方 法 具有 重要 的 理论 意义 和 
实践 价值 。 对 此 ， 遵 循 联合 -层级 建 模 法 (van der 
Linden, 2007), Zhan 等 (2022) 基 于 联合 -层级 认 知 诊 
WERHEZ (Zhan, Jiao, & Liao, 2018) 提 出 了 联合 - 层 
级 多 模 态 认 知 诊断 模型 (joint-hierarchical multimodal 
CDM, H-MCDM); 首次 在 认 知 诊断 领域 实现 对 结 
采 数 据 、 过 程 数据 和 生物 计量 数据 进行 联合 分 析 。 
其 研究 结 末 表明 联合 分 析 多 模 态 数据 不 仅 能 为 个 
体 提 供 更 全 面 的 反馈 还 能 提高 诊断 精度 。 然 而 ， 
Ranger (2013) 指 出 联合 -层级 建 模 的 一 个 主要 理论 
局 限 是 仅 当 洪 在 变量 之 间 的 相关 不 等 于 0 时 ,各 模 
态 数 据 之 间 的 信息 才能 相互 被 利用 ; 进而 才 有 可 能 
实现 利用 辅助 数据 所 提供 的 信息 提高 对 核心 特质 
(如 ， 湾 在 能 力 ) 的 估计 精度 (Bolsinova & Tijmstra, 
2018)。 对 此 ， 有 人 研究 者 提出 联合 - 交 又 负载 建 模 法 
(Bolsinova & Tijmstra, 2018; Molenaar et al., 2015)。 
联合 -交叉 负载 建 模 法 可 视 为 是 对 联合 -层级 建 模 
法 的 拓 广 ,理论 上 可 以 通过 交叉 负载 实现 直接 利用 
辅助 数据 (如 ，RT) 为 核心 特质 (如 ,潜在 能 力 ) 提 供 信 
Меж F H-MCDM 是 遵循 联合 -层级 建 模 法 构建 的 ， 
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理论 上 也 必然 存在 上 述 局 限 性 ; 这 在 一 定 程度 上 可 
能 会 影响 该 模型 的 实践 应 用 性 。 对 此 ， 本 文 聚 焦 于 认 
知 诊断 领域 , 针对 结果 数据 、 过 程 数 据 和 生物 计量 
数据 ， 拟 基于 联合 - 交 又 负载 建 模 法 构建 多 模 态 认 
知 诊断 模型 (joint-cross-loading MCDM, C-MCDM)。 

首先 ， 简单 回顾 两 种 可 联合 分 析 多 模 态 数据 的 
联合 建 模 法 : 联合 -层级 建 模 法 和 联合 -交叉 负载 建 
模 法 ; 其 次 ， 简 单 介 绍 视 党 注视 点 数 (Visual fixation 
count, FC), 一 个 重要 的 眼 动 指标 ; 然后 ,以 传统 的 分 
离 建 模 法 为 始 , 分别 介绍 有 关 RA. RT 和 FC 数据 
的 测量 模型 ,继而 引出 H-MCDM; RE, ЖЖ 
究 新 提出 的 3 个 C-MCDM,， 基于 实证 研究 将 新 模型 
与 已 有 模型 进行 对 比 以 展现 新 模型 的 现实 可 应 用 性 
及 相对 优势 ， 并 通过 两 则 模拟 研究 分 别 探究 新 模型 
的 参数 估计 返 真 性 和 相对 于 H-MCDM 的 优势 ; 最 
后 , 总 结 了 研究 结 末 并 探讨 了 未 来 的 研究 方 回 。 


2 多 模仿 数据 的 联合 分 析 


2.1 两 种 联合 建 模 框架 

目前 ， 联 合 -层级 建 模 是 使 用 最 广泛 的 联合 分 
析 多 模 态 数据 的 心理 计量 建 模 方 法 ， 如 图 1(a) 所 
示 。 如 上 文 所 述 , RT 数据 作为 一 种 有 代表 性 的 过 程 
数据 近 些 年 受到 高 度 关注 ,， 研究 者 们 提出 了 多 个 可 
联合 分 析 RA 和 RT 数据 的 联合 -层级 模型 (de Boeck 
& Jeon, 2019; EA 等 , 2017; 詹 沛 达 , 2018)。 ТЕШ 
型 的 联合 -层级 建 模 中 ,第 一 层 中 构建 RA 数据 和 
RT 数据 的 测量 模型 : 潜在 能 力 完全 解释 RA 数据 ， 
潜在 加 工 速度 完全 解释 RT 数据 ; 而 潜在 能 力 和 潜 
在 加 工 速度 之 间 的 关系 以 二 元 正 态 分 布 的 形式 被 


(c) 联合 -交叉 负载 IRT 建 模 
图 1 多 模 态 联合 建 模 示意 图 (以 作答 精度 和 作答 时 间 数 据 为 例 ) 
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建 模 在 第 二 层 结构 模型 中 。 尽 管 儿 乎 所 有 的 联合 - 


层级 模型 都 局 限于 分 析 RA 和 RT 这 两 类 数据 , 但 
由 于 该 建 模 思路 具有 较 强 的 可 扩展 性 ， 基 于 该 建 模 
框架 可 以 实现 对 更 多 类 型 数据 的 分 析 和 对 更 多 类 
型 潜在 建构 的 测量 。 比 如 , Jeon 等 (2021) 通 过 联合 分 
析 RA 数据 和 大 脑 激 活 这 一 生物 计量 数据 , 测量 了 
个 体 的 潜在 能 力 和 大 脑 激 活水 平 。Man 和 Harring 
(2020) 通 过 联合 分 析 RA 数据 、RT 数据 和 FC 数据 ， 
测量 了 个 体 的 潜在 能 力 、 洪 在 加 工 速 度 和 视觉 参与 
度 。Bezirhan 等 (2021) 联 合 分 析 了 RA WHE. RT 数 
据 和 重 访 题目 次 数 , 测量 了 个 体 的 潜在 能 力 、 洪 在 
加 工 速度 和 重 访 题 目 倾 向 。 基 于 联合 -层级 建 模 ， 
在 认 知 诊断 领域 ， Zhan, Jiao 和 Liao (2018) 首 次 将 
RT 数据 引入 认 知 诊断 建 模 中 提出 了 联合 -层级 认 
知 诊断 建 模 框 架 ， 如 图 1(b) 所 示 ; 该 建 模 法 同样 具有 
可 扩展 性 , 通过 加 入 其 他 模 态 数据 的 测量 模型 ， 实 
现 多 模 态 数据 的 联合 分 析 ( 如 , Zhan et al., 2022). 
HX HEB] RA 数据 的 传统 模型 相 比 ，Ranger 
(2013) 指 出 联合 -层级 建 模 的 主要 理论 局 限 是 仅 当 
潜在 能 力 和 潜在 加 工 速 度 之 间 的 相关 系数 不 每 于 0 
时 ,额外 引入 RT 数据 的 联合 -层级 模型 才能 够 提高 
对 潜在 能 力 参 数 的 估计 精度 。Bolsinova 和 Tijmstra 
(2018) 指 出 联合 -层级 建 模 示 充分 利用 RT 数据 所 提 
供 的 信息 ， 即 假设 RT 数据 仅 受 潜在 加 工 速度 的 影 
啊 ， 不 受 洪 在 能 力 的 影响 。 然 而 ， 在 实际 测验 中 ， 
可 能 存在 潜在 能 力 和 潜在 加 工 速度 之 间 的 相关 系 
数 较 小 (Bolsinova et al., 2017; Zhan, Liao, & Bian, 
2018) 以 及 不 同 能 力 的 个 体 在 解决 问题 时 所 花费 的 
时 间 可 能 不 同 (Schaeffer et al., 1993) 的 情况 。 对 此 ， 


(b) 联合 -层级 认 知 诊断 建 模 


(d) 联合 -交叉 负载 认 知 诊断 建 模 


; т 为 潜在 加 工 速度 ; а 为 潜在 属性 ; 了 为 题目 作答 精度 ; 7 为 题目 作答 时 间 ;7 为 题目 数量 ; К 为 属性 数量 ; IRT 为 项 目 
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联合 -交叉 负载 建 模 假设 RT 数据 同时 受 个 体 的 淤 
在 能 力 和 潜在 加 工 速度 的 影响 ， 如 图 1(c) 所 示 ; Ж 
论 上 ,无论 潜 在 能 力 与 潜在 加 工 速度 之 间 的 相关 系 
数 多 大 ，RT 数据 都 可 以 直接 为 潜在 能 力 参 数 的 估 
计 提 供 信 息 ,， 增 加 洪 在 能 力 参 数 的 估计 精度 。 但 目 
前 ， 尚 未 有 研究 将 该 建 模 方 法 引入 认 知 诊断 领域 ， 
这 是 本 文 要 做 的 一 项 工作 。 
22 ”注视 点 数 

在 计算 机 化 测验 中 , 通过 和 通信 式 传 感 硕 可 以 记 
录 个 体 解 决 问题 时 的 生物 计量 数据 ; 其 中 , 眼 动 仪 
是 被 关注 较 多 的 一 种 , 已 被 用 于 大 规模 测评 项 目 之 
中 (Bos et al., 2005, 也 见 Rupp et al., 2010)。 眼 动 指 
标 可 以 提供 有 关 个 体 在 解决 问题 时 的 认 知 过 程 的 
证 据 。 常 见 的 眼 动 指 标 有 注视 点 (提供 眼睛 看 哪里 
言 息 )、 眼 跳 (提供 注视 点 位 置 发 生变 化 的 信息 )、 感 
兴趣 区 (提供 注视 点 聚集 区 域 的 信息 ) 和 回 视 次 数 
(提供 个 体 将 注视 点 返回 到 特定 目标 上 的 次 数 信息 ) 
等 ; 其 中 , 注视 点 是 最 常用 的 指标 , 它 可 以 反映 个 
体 对 视觉 目标 区 域 的 专注 度 (An et al., 2017), 或 视 
觉 目标 区 域 对 个 体 的 重要 性 和 吸引 力 (Poole et al., 
2004)。 聚焦 在 计算 机 化 测验 中 ,作答 题目 时 的 注视 
点 数 ( 即 FC 数据 ) 可 以 反映 个 体 解决 问题 时 的 视觉 
参与 度 (Man & Harring, 2019; Zhan et al., 2022)。 
2.3 ”多 模 态 数据 分 析 

本 文 以 分 析 RA 数据 、RT 数据 和 FC 数据 为 例 ， 
涉及 3 种 可 分 析 多 模 态 数据 的 建 模 法 : 分 离 建 模 法 ， 
联合 -层级 建 模 法 和 联合 -交叉 负载 建 模 法 。 
231 分离 建 模 法 

分 离 建 模 法 延续 传统 心理 计量 学 模型 的 做 法 ， 
对 不 同 模 态 的 数据 分 别 建 模 、 独 立 分 析 。 为 便于 下 
LEB, 将 采用 分 离 建 模 法 分 析 多 模 态 认 知 诊断 数 
据 的 方法 称 为 分 离 多 模 态 认 知 诊断 模型 (separate 
MCDM, S-MCDM)。 在 S-MCDM 中 ,本 文选 用 3 
个 具有 代表 性 的 测量 模型 分 别 来 分 析 RA 数据 、RT 
数据 和 FC 数据 。 

首先 ,选用 高 阶 DINA (higher-order DINA, HO- 
DINA) (de la Torre & Douglas, 2004) 模 型 作为 RA Ж 
据 的 测量 模型 ， 主 要 原因 是 为 与 基于 联合 -层级 建 
模 法 的 H-MCDM 做 对 比 -HO-DINA 模型 可 描述 为 : 

PW; =) = gj; * (17 s; — gM (1) 
logit(P(a,, = 1)) = Y,0, = Yor (2) 

SUP, У, К n 作答 题目 i 的 精度 ; ө, A s; PA 
题目 ; 的 猜测 参数 和 失误 参数 : mv = a 为 被 
W n 对 题目 i 的 理想 作答 ; oi 为 被 试 n 对 属性 的 
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掌握 情况 , ox = 1 表示 “掌握 ”, Ong = 0 表示 “未 掌握 ” 
qi 为 ОЗЕР 1262, RNA i 对 属性 的 考查 情 
况 , qa = 1 表示 “考查 ”gx = 0 表示 “未 考查 ”; yu 和 
Yo 分 别 为 属性 的 区 分 度 参数 和 难度 参数 ; 此 时 ， 被 
试 的 潜在 能 力 水 平 越 高 ， 则 被 试 对 属性 的 掌握 概率 
越 大 。HO-DINA 模型 假设 潜在 属性 之 间 满 足 连接 
缩合 规则 ， 即 被 试 只 有 和 擎 握 题 目 所 考查 的 所 有 属性 
时 其 理想 作答 结 采 才 是 1， 进 而 才 有 和 较 高 概率 正确 
解决 问题 。 

其 次 ,选用 对 数 正 态 RT(lognormal ВТ, LRT) 模 
型 (van der Linden, 2006) 作 为 RT 数据 的 测量 模型 ， 
该 模型 可 描述 为 : 

Tu ~ 057,96) = 


(3) 


2 
O. (nF 2 
——ехр| -—-(logt,; — (8; — 1,)) 
t, N2n | 2 


REP, T, Z4 BG n 作 符 题 目 i 的 时 间 ( 常 以 秒 为 单位 ); 
vs ABR п 的 潜在 加 工 速 度 ， 表示 被 试 投入 到 整个 
测验 中 的 平均 工作 速度 ; &; 为 题目 i 的 时 间 强 度 参数 ， 
表示 完成 题目 ;所 必需 的 时 间 ; о, ААЛ Н тЫ ЇН] 
度 参数 。LRT 模型 假设 当 被 试 的 潜在 加 工 速度 较 高 
时 则 其 RT 较 小 。LRT 模型 也 可 简单 记 为 : 
log(,;) ~ NÉ; -Tn 65) (4) 
最 后 ， 为 实现 对 个 体 视 觉 参 与 度 的 测量 ，Man 
和 Harring (2019) 提 出 了 可 分 析 FC 数据 的 负 二 项 注 
视点 (negative binomial fixation, NBF) 模 型 。NBF 1% 
型 假设 FC 服从 负 二 项 分 布 , 并 将 FC 解释 为 个 体 的 
视觉 参与 度 与 题目 所 需 的 必要 注视 点 数量 之 间 的 
权衡 关系 的 产物 。NBF 模型 描述 了 被 试 n 在 作答 题 
H i 时 , 在 贯 序 、 独 立 的 V. 次 观察 后 成 功 提取 了 
hh 次 关键 信息 的 概率 分 布 ， 即 : 
Vii S (058, т) = 
ГУ +) h; exp(e, +m; ) Ы 
v Th) sa i) Е m] (5) 
zB, VOX n 解答 题目 i 时 的 FC; e 为 被 试 n 
的 潜在 视觉 参与 度 ， 可 反映 被 试 对 问题 情境 中 各 种 
刺激 的 专注 度 ; mi 为 题目 i 的 视觉 强度 参数 ， 表示 
ЕЛМАЙ Н i 所 必需 的 注视 点 数 ; h; 为 题目 i 上 FC 的 
离散 程度 参数 。NBF 模型 也 可 简单 记 为 : 
V,,-NB(exp(e, + m;), d7”) (6) 
Җир, d, =1/ du; ui la, GER uy Y ay NN 
H iB OS ay REST NBF 模型 的 基本 假设 是 ， 
对 于 特定 的 题目 , 被 试 的 视觉 参与 度 越 高 则 其 在 该 
题目 上 的 FC 越 多 。NBF 模型 的 另 一 个 假设 是 被 试 
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对 测验 中 所 有 题目 的 视觉 参与 度 是 恒定 的 ; 该 假设 
类 似 于 LRT 模型 中 潜在 加 工 速度 恒定 的 假设 。 
2.3.2 ”联合 -层级 建 模 法 

近年 来 ， 人们 越 来 越 有 兴趣 去 结合 多 模 态 数据 
所 提供 的 信息 对 感 兴趣 的 心理 现象 提供 统一 的 解 
释 。 实 际 上 , 在 计算 机 化 测验 中 , 对 RA 数据 、RT 
数据 和 FC 数据 的 采集 几乎 是 同时 进行 的 ， 且 它们 
提供 的 是 被 试 在 作答 相同 题目 时 的 平行 信息 (如 ， 
被 试 正 确 作答 某 题 目 耗 时 20 秒 并 投入 30 个 注视 
点 )， 因 此 ， 也 有 研究 者 将 这 类 多 模 态 数据 称 之 为 
平行 数据 (Jeon et al., 2021)。 平 行 数据 最 大 的 优势 在 
于 它们 包含 有 关 同 一 个 问题 解决 过 程 的 平行 信息 ， 
如 果 这 些 信 息 可 以 被 联合 分 析 并 相互 利用 , 不 仅 可 
以 直接 分 析 不 同 潜在 变量 之 间 的 关系 , 还 有 可 能 提 
高 各 自 测量 模型 的 参数 估计 准确 性 。 

基于 联合 -层级 认 知 诊断 建 模 ，Zhan (2022) 
提出 可 同时 分 析 RA 数据 、RT 数据 和 ЕС 数据 的 
H-MCDM。 如 图 2(a) 所 示 , H-MCDM 包含 两 层级 模 
型 : 测量 模型 和 结构 模型 。 在 第 一 层 测 量 模型 中 ， 
对 3 种 模 态 数据 分 别 建 模 ,， 这 与 S-MCDM 类 似 , 不 
FRR; 在 第 二 层 结构 模型 中 , 通过 三 元 正 态 分 布 


来 描述 潜在 能 力 、 潜 在 加 工 速度 和 潜在 视觉 参与 度 
三 者 之 闻 的 关系 : 
Ө, Ho 
©, = | T, |- МУМ | u |, У person , 
En He 
99 
Esso =| Sor cr (7) 
Oge Ore A 
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式 中 , hpeson = (Mos bles he) 为 3 个 潜在 变量 的 均值 向 
E; Lperson 为 3 个 潜在 变量 的 方差 协 方 差 矩阵 。 
2.3.3 ”联合 -交叉 负载 建 模 法 

如 上 文 所 述 ， 联 合 - 层 级 建 模 的 主要 局 限 之 一 
是 : 理论 上 , 仅 当 洪 在 变量 之 间 相 关 不 为 0 时 , 各 
模 态 数据 之 间 的 信息 才能 相互 被 利用 。 为 了 更 直接 
地 利用 RT 和 FC 这 两 个 附属 数据 中 的 信息 ,可 使 用 
联合 - 交 又 负载 建 模 法 ,将 潜在 属性 或 潜在 能 力 直 
接 建 模 在 RT 测量 模型 和 FC 测量 模型 中 。 基 于 该 
逻辑 , 本 文 提 出 3 个 C-MCDM， 如 图 2(b)~2(d) 所 示 ， 
分 别 为 基于 潜在 能 力 的 C-MCDM (C-MCDM-0)、 基 
于 连接 缩合 规则 的 C-MCDM (C-MCDM-D) 和 基于 
补偿 缩合 规则 的 C-MCDM (C-MCDM-C)。3 个 模型 
遵循 不 同 的 逻辑 假设 ， 其中，C-MCDM-6 假设 被 试 
的 潜在 能 力 的 变化 会 影响 其 完成 该 题目 的 耗 时 及 
所 用 注视 点 数 ; 而 C-MCDM-D 和 C-MCDM-C 均 假 
设 被 试 的 潜在 属性 掌握 情况 会 影响 其 完成 该 题目 
的 耗 时 和 注视 点 数 ， 两 者 差异 在 于 前 者 认为 仅 有 被 
试 掌握 了 题目 所 考查 的 所 有 属性 后 才 会 影响 RT 和 
FC， 而 后 者 认为 被 试 掌握 该 题目 所 考查 的 属性 的 
数量 会 影响 RT 和 FC ( 即 掌 握 的 越 多 影响 越 大 )。 3 
外 ,为 保证 与 S-MCDM 和 H-MCDM 具有 可 比 性 ， 
本 文 设 定 在 C-MCDM-D 和 C-MCDM-C 中 也 存在 
高 阶 潜在 结构 , 但 是 否 存在 高 阶 潜在 结构 不 影响 建 
模 。 再 有 ,为 了 保证 模型 的 可 识别 性 ( 即 Ө, fH т, Z 
间 的 以 及 Ө, 和 е, 之 间 的 相关 性 已 经 被 交叉 负载 解 
释 ), 在 3 个 C-MCDM 中 并 没有 使 用 三 元 正 态 分 布 来 
联接 潜在 能 力 、 洪 在 加 工 速度 和 洪 在 视觉 参与 度 这 
3 个 潜在 变量 (Bolsinova & Tijmstra, 2018; Molenaar 


(a) 联合 -层级 多 模 态 认 知 
诊断 模型 (H-MCDM) 


(b) 基于 潜在 能 力 的 联合 - 
交叉 负载 多 模 态 认 知 诊断 模型 (C-MCDM-0) 


(c) 基于 连接 缩合 规则 的 联合 - 
交叉 负载 多 模 态 认 知 诊断 模型 (C-MCDM-D) 
图 2 联合 -层级 和 联合 -交叉 负载 多 模 态 认 知 诊断 建 模 示意 图 
;Tt 为 潜在 加 工 速度 ; e 为 潜在 视觉 参与 度 ; а 为 潜在 属性 ; Y 为 题目 作答 精度 ; T 为 题目 作答 时 间 ; V 为 注视 点 数 ; Т 
题目 数量 ; K 为 属性 数量 . 


ik: 9 为 潜在 能 


(d) 基于 补偿 缩合 规则 的 联合 - 
交叉 负载 多 模 态 认 知 诊断 模型 (C-MCDM-C) 


et al.，2015)。 小 规模 模拟 研究 结果 显示 在 当前 
C-MCDM 基础 上 再 采用 三 元 正太 分 布 联接 3 PS 
在 变量 后 会 导致 参数 估计 不 收敛 , 尤其 是 三 元 正太 
分 布 中 的 方差 和 协 方差 。 

为 便于 表达 , 用 统一 模型 来 表示 3 个 C-MCDM, 
首先 ， 对 RA 数据 而 言 仍 选用 HO-DINA 模型 作为 
其 测量 模型 ( 见 公 式 (1))。 其 次 ,对 RT 数据 和 FC 数 
据 而 言 ， 它们 的 测量 模型 可 分 别 表示 为 : 

log(T) ~ NCE -&;f(6,,9,.43)) -,). or ) (8) 

V, NBCexp((m; +2,7(9,,а,,9:))+=,), d;^) (9) 
TU, PR (On, Ons ERITA FES ES EN 
H i, 潜在 能 力 或 潜在 属性 如 何 影 响 其 RT ЯП FC: 

0 for C-MCDM-0 


n 


f(0,,0,,q;,) = IL. @ for C-MCDM-D . 


(10) 
> - O nk ik for C-MCDM-C 


ф I A; 2791] 2 PRA (9, On, qi XT RT 和 FC 的 加 权 系 
BL AAC Х #1; 以 C-MCDM-D 为 例 , o; 和 六 分 别 表 
7х, ТРАН i, 理想 作答 为 1 的 被 试 和 理想 作答 为 
0 的 被 试 之 间 ( 对 数 )RT 和 FC 的 均值 的 差异 。 鉴 于 
已 有 研究 表明 潜在 能 力 与 潜在 加 工 速度 之 间 并 不 
总 是 正 相 关 (Zhan, Jiao, & Liao, 2018)， 因 此 , 3 个 模 
型 中 并 不 限制 w 和 X; 的 正 负 号 , 而 由 数据 驱动 决 
定 。 对 于 题目 i o> 0 时 , 一 定 程度 反映 了 题目 
i 对 被 试 作答 时 需 付出 的 认 知 负荷 的 要 求 相 对 较 低 
(АП, 速度 测 验 中 的 题目 ),， 进 而 能 力 较 高 (或 属性 掌 
握 越 多 ) 的 被 试 会 使 用 相对 更 少 的 时 间 来 作答 ， 而 
能 力 较 低 的 被 试 会 使 用 相对 更 多 的 时 间 来 作答 ; 而 
当 w < OW, 一 定 程 度 反 映 了 题目 i 对 被 试 作答 时 
需 付 出 的 认 知 负荷 的 要 求 相 对 较 高 (如 ,难度 测验 
中 的 题目 )， 进 而 能 力 较 高 的 被 试 会 使 用 相对 更 多 
的 时 间 来 作答 ， 而 能 力 较 低 的 被 试 会 使 用 相对 更 少 
的 时 间 来 作答 (可 能 是 动机 较 低 导致 的 (Wise & Kong, 


2005; Zhan, Лао, & Liao, 2018)). Е, РӘН i, 
MOM > 0 时 , 一定 程 度 反 映 了 题目 i 所 涉及 的 关键 
信息 的 数量 较 多 ,进而 能 力 较 高 的 被 试 在 作答 该 题 
目 时 会 使 用 相对 更 多 的 注视 点 ,而 能 力 较 低 的 被 试 
会 使 用 相对 较 少 的 注视 点 ( 即 难 以 提取 到 所 有 的 关 
键 信息 ); ЧА < О, — ERER ГАН i 
涉及 的 关键 信息 的 数量 较 少 ,进而 能 力 较 高 的 被 试 
在 作答 该 题目 时 会 使 用 相对 更 少 的 注视 点 ， 而 能 
较 低 的 被 试 会 使 用 相对 较 多 的 注视 点 (可 能 是 受到 
无 关 信 息 干 扰 ， 难 以 确定 关键 信息 的 位 置 )。 另 外 ， 
由 于 9; 和 是 同一 道 题目 的 参数 ， 所 以 理论 上 有 4 
种 组 合 ， 如 表 1 所 示 ; 当然 , 表 1 中 的 描述 只 是 一 
种 可 能 性 ， 实践 中 还 需要 针对 具体 问题 具体 分 析 。 

另外， 鉴于 在 认 知 诊断 中 提高 潜在 属性 的 诊断 
准确 率 才 是 关键 , 3 个 C-MCDM 均 未 考虑 潜在 加 工 
速度 和 潜在 视觉 参与 度 对 RA 的 影响 ， 即 不 考虑 利 
用 RA 数据 信息 提高 这 两 个 潜在 变量 的 参数 估计 准 
确 性 ; 也 没有 考虑 RT 数据 和 FC 数据 之 间 信 息 的 相 
互利 用 , 仍 假设 潜在 加 工 速度 和 潜在 视觉 参与 度 之 
间 存 在 相关 。 此 时 , 可 以 用 二 元 正 态 分 布 描述 潜在 
加 工 速 度 和 洪 在 视觉 参与 度 之 间 的 关系 : 


T 
9, -| "муу 网 a | 
En Hs 


; (11) 
01 

Z non 一 | ; 
Or Ое 


2.3.4” 认 知 结构 诊断 及 认 知 特征 推断 

Scb E, 相 比 于 传统 的 仅 分 析 RA 数据 的 CDM 
而 言 , SSMCDM, H-MCDM 和 3 个 C-MCDM 均 能 
实现 对 多 模 态 数据 的 分 析 , 人 研究 者 也 均 可 以 基于 分 
析 结 果实 现 对 个 体 认 知 结构 的 诊断 及 其 他 认 知 特 
TEA HEMT. Fk T. Hoc. 在 MCDM "f, 作为 
RA 数据 的 测量 模型 , HO-DINA 模型 的 主要 功能 就 
是 诊断 个 体 对 潜在 属性 的 掌握 情况 ， 因 此 ,潜在 属 


表 1 C-MCDM 中 9; 入 参数 的 正 负 取 值 可 能 反映 的 题目 信息 


>0 
关键 信息 多 , UA Ay ZOE: 


>0 7r ff, On, а) 1, 则 RTJ,FCT; 
zi fO, Ons qi) ls WW RTT,FCI; 


关键 信息 多 , 认 知 负 和 从 要 求 高 : 


<0 若 f0,,0,9i) T, WJRTT,FCÍ; 
ж ДӨ On, 4) 1, WRTL,FCL; 


Ki 
<0 

RRMA BD, AMH fur ERK: 
若 ft0;, An qi) [em 则 RTJ ,FCJ; 
$i AKOn anq) i, WIRTT,FCT; 

RRMA AD, VARI fa fur EO үп: 
若 f(0,, Ons Gi) ie Д RT1,FCi; 
ж AKOn anq) +, WRT), FCT; 


TE: gi FU A; ОУ РАЖ (On, On, qi) 对 RT ЕС 的 交叉 载荷 ; 9 为 潜在 能 力 ; а 为 潜在 属性 ; а 为 题目 所 考查 的 属性 ; T 为 增加 ， 为 下 


降 ; RT 为 题目 作答 时 间 ; FC 为 注视 点 数 . 
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表 2 8 种 认 知 特征 综合 类 别 及 可 能 的 原因 或 行为 表现 (Zhan et al., 2022) 


认 知 特征 推断 
认 知 流畅 + 聚焦 者 
认 知 流畅 + 非 聚焦 者 
沉思 型 + 聚焦 者 
沉思 型 + 非 聚 焦 者 
冲动 型 + 聚焦 者 
冲动 型 + 非 聚 焦 者 
认 知 不 流畅 + 聚焦 者 
认 知 不 流畅 + 非 聚 焦 者 


可 能 的 原因 或 行为 表现 
有 能 力 全 面 提取 题目 中 的 关键 信息 
有 能 力 排 除 和 干扰 ， 提 取 题 目 中 少 有 的 关键 信息 
基于 已 提取 的 关键 信息 ,对 可 能 问题 解决 方法 深思 熟 虑 
有 能力 排 除 干扰 ， 基 于 少量 的 关键 信息 进行 深思 熟 虑 
快速 提取 一 些 信息 , 快速 验证 问题 解决 方法 
未 充分 提取 信息 , 倾向 于 快速 猜测 
有 作答 动机 但 认 知 能 力 较 低 
缺乏 作答 动机 


注 : 0 为 潜在 能 力 ; т 为 潜在 加 工 速度 ; e 为 潜在 视觉 参与 度 ; + 为 大 于 均值 ; -为 小 于 均值 . 


性 模式 的 诊断 结果 可 以 较为 直接 地 反映 个 体 的 认 
知 结构 。 其 次 , 在 MCDM Ф, 额外 使 用 了 LRT Ж 
型 和 NBF 模型 分 别 作 为 RT 和 FC 数据 的 测量 模型 。 
与 HO-DINA 模型 中 将 被 试 参 数 设 为 类 别 变 量 不 同 ， 
LRT 模型 和 NBF 模型 中 的 被 试 参 数 为 连续 变量 ; 
因此 , 无 法 像 对 潜在 属性 的 诊断 一 样 直接 对 个 体 的 
潜在 加 工 速度 和 潜在 视觉 参与 度 进行 分 类 ,进而 无 
法 直接 实现 对 个 体 认 知 特征 的 分 类 。 

对 此 ， 一 种 较为 简单 明了 的 方式 是 利用 均值 作 
为 切 点 : 当 个 体 的 潜在 能 力 大 于 均值 时 表明 该 个 体 
属于 认 知 能 力 ( 如 ,问题 解决 能 力 ) 相 对 较 高 的 一 类 ， 
反之 则 反 ; 当 个 体 的 潜在 加 工 速度 大 于 均值 时 表明 
该 个 体 属 于 加 工 速度 相对 较 快 的 一 类 , 反之 则 反 : 
当 个 体 的 潜在 视觉 参与 度 大 于 均值 时 表明 该 个 体 
属于 专注 度 较 高 的 一 类 , 反之 则 反 。 理 论 上 , 三 者 
进一步 组 合 ， 可 得 到 8 种 认 知 特征 综合 类 别 (Zhan 
et al., 2022); 表 2 呈现 了 这 8 种 认 知 特征 综合 类 别 
及 可 能 的 原因 或 行为 表现 。 当 然 , 需要 强调 的 是 这 
种 分 类 方式 是 比较 粗糙 的 , 适用 于 对 个 体 认 知 特征 
的 粗略 推断 ,并 非 精确 的 测量 或 诊断 结 
2.4 ” 贝 叶 斯 参数 估计 

本 文 使 用 全 贝 叶 斯 马尔 可 夫 链 蒙特 卡 洛 算法 
对 S-MCDM, H-MCDM 和 з 个 C-MCDM 进行 参 
数 估 计 , 并 基于 JAGS (Plummer, 2015) 实 现 。 网 络 
版 附录 51 章节 中 呈现 了 模型 参数 估计 对 高 、 中 和 
低 信息 先 验 分 布 的 鲁 棒 性 分 析 结 果 ， 结 果 表 明 新 模 
型 对 包含 不 同 信息 量 的 先 验 分 布 具 有 一 定 的 鲁 棒 
性 。 结 合 已 有 实证 数据 分 析 经 验 和 已 有 研究 结 
(Man & Harring, 2019; Zhan et al., 2022)， 正 文 所 有 
参数 估计 均 采 用 中 信息 先 验 分 布 。 示 例 数 据 及 相应 
的 JAGS 代码 已 分 享 在 网 络 版 附录 中 ,关于 如 何 使 
用 JAGS 进行 由 叶 斯 参数 估计 可 参见 Zhan 等 
(2019)。 


з 实证 数据 分 析 

鉴于 本 文 所 提出 模型 中 包含 w 和 入 两 个 新 参 
数 ， 暂 缺乏 对 它们 的 取 值 范围 的 了 解 ， 难以 进行 恰 
当 的 模拟 研究 ( 即 , 不 知 根据 何 种 分 布 来 生成 它们 
的 真 值 ); 因此 需要 先进 行 实证 研究 ， 以 展现 新 模 
型 的 实践 可 应 用 性 ， 并 为 模拟 研究 中 参数 真 值 生成 
提供 参考 依据 。 

3.1 数据 描述 和 分 析 

为 对 比 3 种 多 模 态 数据 分 析 方 法 ( 即 5 个 
MCDM) 的 表现 ,我 们 选用 来 和 目 一 项 技术 增强 测评 
环境 下 的 数学 测验 的 数据 。 该 数据 “在 美国 东海 岸 一 
所 大 学 的 眼 动 实验 室 采 集 的 (Man & Harring, 2019), 
其 中 包括 N = 93 名 (矫正 ) 视 力 正常 的 大 个 体 对 了 = 
10 道 题 目的 作答 。 该 测验 考查 K = 4 个 潜在 属性 : 
(ol) 算 数 (arithmetic) 、(oz) 代 数 (algebral) (оз) JL {Ay 
(geometry) 和 (04) 数 据 分 析 (data analysis), 测验 О XR 
阵 见 图 3。 该 数据 包含 3 种 同时 采集 的 数据 : 结果 
数据 ( 即 RA), 、 过 程 数据 ( 即 RT) 和 生物 计量 数据 ( 即 
FC)。 另 外 ， 有 关 该 数据 更 详细 的 描述 请 参阅 Man 
和 Harring (2019)。 注 意 , Man 和 Harring (2019) 使 用 
的 是 语言 推理 数据 ， 而 Zhan 等 (2022) 及 本 文 使 用 的 
是 同一 批 次 采集 的 数学 测验 数据 。 

分 别 使 用 S-MCDM H-MCDM 和 3 个 C-MCDM 
分 析 该 数据 。5 个 模型 均 使 用 两 条 马尔 可 夫 链 (随机 
起 点 )， 每 条 链 包 含 60, 000 次 迭代 ( 预 热 40, 000 次 )， 
ЖИЙ 1; 最终 剩余 40, 000 次 迭代 用 于 计算 后 验 均 
值 和 后 验 标准 差 。 使 用 潜在 量 尺 缩减 因子 (PSRF) < 
1.2 (Brooks & Gelman, 1998) 作 为 参数 估计 收敛 检验 


”需要 强调 的 是 由 于 该 数据 中 涉及 到 某 高 利害 测验 中 敏感 信息 
(例如 , 题目 )， 所 以 该 数据 并 不 对 外 公开 。 但 研究 者 可 以 尝试 向 
Man 和 Harring (2019) 或 Zhan 等 (2022) 的 通讯 作者 以 合理 的 理 
由 索取 。 
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图 3 实证 数据 О; 日 色 表 示 “0”， 灰 色 表 示 “1” 


标准 (Brooks & Gelman, 1998; de la Torre & Douglas, 
2004)。 使 用 后 验 预测 模型 检验 (posterior predictive 
model checking) (PPMC; Gelman et al., 2014) 来 评估 
模型 -数据 绝对 拟 合 ， 其 中 后 验 预 测 概率 (posterior 
predictive probability, ppp) 接 近 0.5 表示 模型 与 数据 
拟 合 (通常 , ppp < 0.05 或 ppp > 0.95 可 被 视 为 不 拟 
(Gelman et al., 2014))。 在 PPMC 中 使 用 测验 统计 
(test statistics) ( 即 仅 关 注 真 实数 据 与 预测 数据 之 
间 的 差异 , 不 涉及 具体 模型 参数 ) (Levy & Mislevy, 
2016)。 由 于 目前 缺乏 针对 联合 模型 的 绝对 拟 合 评价 
指标 ,在 3 个 模型 中 , 我 们 均 分 别 评 佑 不 同 模 态 数 
据 与 其 测量 模型 之 间 的 拟 合 关 系 。 此 外 , 使 用 DIC 
作为 模型 -数据 的 相对 拟 合 指 标 用 于 模型 选择 ; 指 
标 值 越 小 表示 模型 与 数据 拟 合 的 越 好 。 
32 结果 

表 3 呈现 了 5 个 多 模 态 模型 对 该 数据 的 拟 合 情 
况 。 需 要 强调 的 是 , 由 于 C-MCDM-D 中 约 39.71% 
的 待 估计 参数 (包括 £i, Si Gi, Qj, Mi, di, Qi, №, Yoks Yik 
Onks Ons Tn, 8, 65, O2, 62, бер, Oye, Ore ) 和 C-MCDM- 
C HAY 29.35% 的 待 佑 计 参 数 (同上 ) 并 未 达到 收敛 标 
准 (PSRF < 1.2), 因此 , 这 两 个 模型 与 数据 的 拟 合 
结果 仅 供 参考 , 在 实证 研究 中 不 再 参与 后 续 探 讨 。 
首先 , 根据 ppp 值 ， 表明 S-MCDM, H-MCDM 和 
C-MCDM-0 中 的 测量 模型 均 拟 合 该 数据 。 进 一 步 ， 
DIC 指标 值 判断 C-MCDM-0 对 该 数据 的 相对 拟 合 
最 好 , H-MCDM 其 次 , S-MCDM 最 差 。 该 结果 说 明 ， 
对 于 提供 平行 信息 的 多 模 态 数据 而 言 ， 两 种 联合 建 
模 法 均 比 分 离 建 模 法 的 表现 更 优 ; 且 基 于 联合 - 交 
又 负载 建 模 法 的 C-MCDM 表现 优 于 基于 联合 - 层 
级 建 模 法 的 H-MCDM。 


RI 实证 数据 中 模型 -数据 拟 合 指标 

Model -2LL DIC 
S-MCDM 11104.13 1189070 0.42 0.52 0.78 
H-MCDM 11040.62 11804.00 0.42 0.51 0.57 
C-MCDM-0 10275.27 11542.78 0.43 0.51 0.68 
C-MCDM-D 10127.21 10549.14 0.40 0.52 0.64 
C-MCDM-C 10009.65 10434.95 0.36 0.51 0.67 


ррр RA ppp RT ppp FC 


ik: -2LL = -2 log likelihood; DIC = deviance information 
criterion; ppp = 后 验 预 测 概率 ; RA = 作答 精度 ; RT = 作答 时 
间 ; FC = 注视 点 数 。 


通过 观察 H-MCDM 中 洪 在 能 力 与 潜在 加 工 速 
度 的 估计 值 之 间 的 相关 系数 (-0.008, SE = 0.278) 和 
潜在 能 力 与 潜在 视觉 参与 度 的 估计 值 之 间 的 相关 
系数 (0.004, SE = 0.252)， 可 发 现 两 相关 系数 均 接近 
于 0, 理论 上 难以 发 挥 H-MCDM 相 较 于 S-MCDM 
的 优势 ; 反观 ,由 于 C-MCDM-0 可 以 直接 利用 RT 
和 FC 数据 中 的 信息 来 降低 对 潜在 能 力 参 数 的 估计 
标准 误 ( 见 图 4), 所 以 导致 该 模型 对 数据 的 拟 合 相 
对 更 好 。 下 文 将 基于 C-MCDM-0 模型 的 分 析 结 果 
DEFT Ж 
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0.2 
S-MCDM 


图 4 实证 数据 中 潜在 能 力 参 数 估计 后 验 标准 差 ( 标 准 误 ) 


H-MCDM 


C-MCDM-0 


K 4 呈现 了 C-MCDM-0 模型 中 3 个 测量 模型 
的 参数 估计 值 及 9; 和 入 ;的 估计 值 。 首先 ， 对 测量 模 
型 中 参数 而 言 ， 该 结果 与 Zhan 等 (2022) 的 估计 结 
基本 一 致 。 其 中 ,前 两 题 的 猜测 参数 较 大 ， 而 第 6 
题 的 失误 参数 较 大 。 各 题目 的 时 间 强 度 参数 的 平均 
值 约 为 3.33， 表 明 被 试 完 成 这 些 题目 所 必须 的 平均 
耗 时 约 为 28 秒 (接近 该 数据 中 RT 的 均值 33.99)。 
各 题目 的 视觉 强度 参数 的 平均 值 约 为 4.68， 表明 被 
试 完 成 这 些 题目 所 必须 的 注视 点 数 约 为 107 个 ( 接 
近 该 数据 中 ЕС 的 均值 114.53)。 其 次 , 对 o; 和 А, 
而 言 , 一 个 显著 特点 是 对 于 同一 道 题目 两 参数 的 正 
负 号 相反 。 结 合 表 1 中 的 描述 ,表明 该 测验 中 题目 
所 包含 的 关键 信息 数量 与 认 知 负荷 要 求 相 匹配 ， 即 
关键 信息 多 则 认 知 负荷 要 求 高 ,反之 则 反 。 进一步 ， 
图 5 呈现 o; 入 的 估计 值 分 布 。 发 现 ;估计 值 的 
中 位 数 < 0, 一 定 程度 反映 该 测验 中 多 数 题 目的 认 
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表 4 实证 数据 中 C-MCDM-0 模型 的 题目 参数 估计 值 
xd 作答 精度 作答 时 间 注视 点 数 
题目 р о ш „— 9 入 
g 5 5 e m d 
1 (1010) 0.71 (0.23)  0.06(0.04) 2.89 (0.04) 3.78 (0.340) 4.23 (0.04) 0.08 (0.011) 0.25 (0.05)  —0.22 (0.04) 
2 (1100) 0.60 (0.22) 0.05 (0.04) 3.43 (0.05) 2.56 (0.20) 4.85 (0.04) 0.03 (0.002) 0.07 (0.06) 0.13 (0.04) 
3 (1100) 0.33 (0.13) 0.38 (0.11) 2.60 (0.06) 2.65 (0.25) 3.87 (0.05) 0.07 (0.010) 0.43 (0.07) 0.40 (0.05) 
4 (0100) 0.31 (0.21) 0.18 (0.08) 3.34 (0.05) 2.56 (0.20) 4.68 (0.04) 0.03 (0.003) 0.11 (0.06) 0.15 (0.04) 
5 (0010) 0.49 (0.20) 0.25 (0.07) 3.13 (0.07) 1.83 (0.14) 4.50 (0.05) 0.03 (0.002) 0.21 (0.08)  —0.18 (0.06) 
6 (0100) 0.09 (0.04) 0.86 (0.077 3.08 (0.08) 3.14 (0.42) 4.42 (0.07) 0.05 (0.012) 0.65 (0.08) 0.61 (0.07) 
7 (0001) 0.43 (0.19) 0.22 (0.11) 3.74 (0.06) 1.98 (0.16) 5.06 (0.05) 0.02 (0.001) 0.22 (0.07) 0.19 (0.06) 
8 (1001) 0.15 (0.08) 0.61 (0.16) 3.92 (0.06) 2.88 (0.29) 5.18 (0.06) 0.02 (0.002) 0.43 (0.07) 0.41 (0.06) 
9 (0001) 0.44 (0.13) 0.36 (0.10) 3.41 (0.10) 1.22 (0.10) 4.82 (0.07) 0.01 (0.001) 0.07 (0.12) 0.17 (0.08) 
10 (1001) 0.11 (0.06) 0.73 (0.15) 3.80 (0.12) 1.13 (0.10) 5.18 (0.09) 0.01 (0.001) 0.31 (0.14) —0.29 (0.10) 


iE: g = 猜测 参数 ; s= 失误 参数 ; 5 = 时间 强度 参数 ; о = 时 间 精 度 参数 ; т = 视觉 强度 参数 ; d = 视觉 区 分 度 参数 ; 括号 内 为 标准 误 


(后 验 标准 差 )。 


图 5 实证 数据 中 C-MCDM-9 模 型 的 9; 入 估计 值 分 布 


知 负 三 要 求 相对 较 高 ， 进 而 个 体 的 潜在 能 力 越 高 则 
其 解 题 时 所 消耗 的 时 间 越 长 ; 另外 ,发 现 入 估 计 值 
的 中 位 数 > 0, 一 定 程度 反映 该 测验 中 多 数 题目 所 
包含 的 关键 信息 数量 较 多 ， 进 而 个 体 的 潜在 能 力 越 
高 则 其 解 题 时 所 呈现 的 注视 点 数 越 多 。 

表 5 呈现 了 基于 C-MCDM-0 模型 的 反馈 样 例 ， 


包括 对 认 知 结构 和 其 他 认 知 特征 的 反馈 信息 ,以 展 
现 联 合 分 析 多 模仿 数据 的 优势 。 以 被 试 5、9 和 65 
为 例 , 3 人 在 潜在 属性 上 的 诊断 结果 相同 , 但 他 /她 
们 在 潜在 能 力 、 洪 在 加 工 速度 和 潜在 视觉 参与 度 上 
的 估计 值 有 较 大 差异 ; 这 表明 即便 他 /她 们 具有 相 
同 的 认 知 结构 ， 他 /她 们 在 认 知 风格 或 认 知 流畅 性 
等 认 知 特征 方面 也 可 能 不 同 。 为 外 ,对 于 认 知 结构 
AGRA A BIR, APSA EP XT PEP TL, BRIER AY 
在 属性 外 ,还 应 考虑 不 同 个 体 的 认 知 特征 , 采取 更 
恰当 的 干预 措施 。 比 如 , 被 试 34 和 67 均 缺 失 属 性 
2 和 4, 但 由 于 两 者 的 认 知 特征 不 同 , 或 许可 以 尝试 
不 同 的 有 针对 性 干预 措施 。 对 于 被 试 34 (冲动 型 + 
非 聚 焦 者 ) 而 言 ， 由 于 其 倾 回 于 仅 根据 从 问题 情境 
中 提取 的 部 分 信息 就 仓促 做 出 决定 ， 除 缺失 的 潜在 
属性 外 ,还 可 以 尝试 培养 该 被 试 的 视觉 参与 度 ,并 
KWARTA, ERER. MEA 67 ( 认 庆 不 流 
畅 + 聚 焦 者 ) 似 乎 有 解决 问题 的 动机 或 欲望 但 由 于 
能 力 有 限 即 便 视觉 参与 度 较 高 也 无 法 提取 题目 中 


表 5 实证 数据 中 个 体 认 知 结 构 诊 断 及 其 他 认 知 特征 推断 样 例 


被 试 on 02 оз 04 0 
5 1 1 1 1 0.12 (0.25) 
9 1 1 1 1 0.31 (0.23) 
34 1 0 1 0 —0.19 (0.26) 
65 1 1 1 1 0.25 (0.24) 
67 1 0 1 0 —1.52 (0.27) 
76 1 1 1 0 0.56 (0.25) 
а 


т € 认 知 特征 推断 
—0.17 (0.11) 0.20 (0.09) 沉思 型 + 聚焦 者 
0.05 (0.11) 0.06 (0.08) 认 知 流畅 + 聚焦 者 
0.20 (0.11) —0.06 (0.08) 冲动 型 + 非 聚焦 者 
0.20 (0.11) —0.22 (0.09) 认 知 流畅 + 非 聚焦 者 
-0.18 (0.11) 0.10 (0.09) 认 知 不 流畅 + 聚焦 者 
—0.01 (0.11) —0.12 (0.09) 沉思 型 + 非 聚焦 者 


TE: 0 = 潜在 能 力 ;t= 淤 在 加 工 速度 ; s = 潜在 视觉 参与 度 ; 括号 内 为 标准 误 ( 后 验 标准 差 )。 


第 11 期 


的 关键 信息 ; 所 以 对 该 被 试 而 言 ， 应 该 着 重 补救 其 
所 缺失 的 潜在 属性 。 


4 ”模拟 研究 


上 文 已 经 通过 实证 研究 展示 了 新 模型 的 实用 
性 及 相对 优势 。 本 节 通 过 两 则 模拟 研究 进一步 探究 
新 模型 的 心理 计量 学 性 能 。 其 中 , 研究 1 拟 在 多 种 
模拟 测验 条 件 下 探究 新 模型 的 参数 估计 返 真 性 ; 研 
究 2 拟 对 比 新 模型 和 H-MCDM 的 相对 表现 ， 以 展 
现 新 模型 的 相对 优势 及 考虑 交叉 负载 的 必要 性 。 
41 模拟 研究 1 
41.1 数据 生成 与 分 析 

模拟 研究 中 , 设 定 3 个 操纵 变量 : (1) 样 本 量 N: 
100 和 500, 考虑 到 CDM 的 实际 应 用 场景 及 眼 动 研 
究 目 前 可 能 的 被 斌 数量, 本 人 研究 主要 关注 新 模型 在 
小 样本 条 件 下 的 表现 ; (2) 3 ДЕ 7: 158030, 固定 
潜在 属性 数量 K = 5, О 和 矩阵 见 图 6 (该 Q 矩阵 满足 
DINA 模型 的 参数 可 识别 性 要 求 (Gu & Xu, 2021)); 


和 0.5 的 设 定 参 考 实 证 数据 分 析 结 果 ( 见 表 4)， 而 设 
置 0 的 目的 是 为 了 探究 当 不 存在 交叉 负载 时 新 模型 


的 表现 。 
被 试 的 潜在 能 力 、 潜 在 加 工 速度 和 潜在 视觉 参 
与 度 按 如 下 方法 生成 : 
0, 0) {1 
т, |~ МУМ | 0 025 (12) 
e, 0) (0 -0.125 025 


该 设 定 中 рь = —0.5 参考 了 上 文 实证 研究 结 
№ Zhan, Jiao #1 Liao (2018) 和 Man 和 Harring (2019) 
的 设 定 : 假设 个 体 的 加 工 速度 越 慢 则 视觉 参与 度 越 
高 ( 即 沉 思 型 多 匹配 聚焦 者 ); 同时 , 个体 学 习 的 加 
工 速度 越 快 则 视觉 参与 度 越 低 ( 即 冲动 型 多 匹配 非 
聚焦 者 ); DI, HME 2(b)~2(d) 中 的 设 定 , 设 定 
Рет = 0 和 Pos = 0, 原因 是 在 交 又 负载 认 知 诊断 建 模 
法 中 0 与 + 之 间 的 关系 及 90 与 8 之 间 的 关系 已 经 由 
ACM AN fat HEFT IA o 

另外 , 参考 上 文 实证 研究 结果 及 Zhan, Jiao 和 
Liao (2018), Man 和 Harring (2019) 的 设 定 , 题目 参 
数 按 如 下 方法 生成 


ЈА: 引入 眼 动 注视 点 的 联合 -交叉 负载 多 模 态 认 知 诊断 建 模 1425 
xx, -2.197 1 
уу, 43941105 1 
~MVN | (13) 
E, 4 -025 -025 025 


т; 4 —0.25 -0.25 0.125 0.25 


此 时 , 题目 的 g; 和 s; 参数 分 别 为 g = exp(xx;)/ 
1+exp(xx;) 和 s; = 1— exp(xx; + yy;)/1+exp(xx; + уу) o 
该 设 定 (pss = 0.5. рр = —0.5. pg, = —0.5, р = -0.5、 
Pam = —0.5 和 Pem = 0.5) 假 设 题目 的 猜测 参数 越 高 则 
其 时 间 强 度 参数 和 视觉 强度 参数 越 小 。 此 外 ,题目 
时 间 精 度 参数 和 视觉 离散 程度 参数 分 别 从 均匀 分 
布 和 逆 Gamma 分 布 生成 : 

о; ~ U (1.25, 2)ffll А, -InvGamma (2, 6)。 另 外 ， 
属性 区 分 度 参数 被 固定 为 yx = 1.5, 属性 难度 参数 
被 固定 为 yo = (-1.5, —0.5, 0, 0.5, 1.3)”， 并 依据 公式 
2 生成 被 试 的 属性 模式 。 

最 后 , 在 6 种 (2 样本 量 x 2 测验 长 度 x 2 交叉 
载荷 ) 模 拟 测 验 条 件 下 ， 分 别 依据 C-MCDM-0, 
C-MCDM-D 和 C-MCDM-C 各 生成 30 组 平行 数据 
(RA 数据 、RT 数据 和 FC 数据 )。 

在 每 种 模拟 测验 条 件 中 ,使 用 数据 生成 模型 作 
为 分 析 模 型 ,对 于 每 组 数据 , 3 个 分 析 模 型 均 使 用 两 
条 马尔 可 夫 链 (随机 起 点 )， 除 每 条 马尔 可 夫 链 长 减 
>< 10, 000 次 迭代 ( 预 热 5, 000 次 )， 各 模型 的 参数 
估计 设 定 与 实证 研究 中 保持 一 致 。 使 用 PSRF < 1.2 
作为 参数 估计 收敛 指标 。 使 用 ppp 值 作为 模型 - 数 
据 绝对 拟 合 指标 ， 使 用 DIC 作为 模型 -数据 相对 拟 
合 指标 ; 使 用 属性 判 准 率 ACCR = X£, X, (à, = 
Ong) NR 和 属性 模式 判 准 率 PCCR - XA, УУ |1 
(ân = @„)/ NR 作为 潜在 属性 的 判 准 率 指标 ,并 使 
用 偏差 bias(%) = 3, &—x/ RIGA 481823 RMSE) = 
ЗЕ х) / R 及 参数 估计 值 与 真 值 之 间 的 相关 
系数 (Cor) 来 评估 其 他 参数 估计 的 返 真 性 , RP R = 
30 为 数据 组 数 。 

4.3. ”结果 

在 所 有 模拟 测验 条 件 下 ,3 个 分 析 模 型 中 的 所 
有 参数 的 РЅВЕ 值 均 满 足 PSRF < 1.2 的 收敛 标准 
(Н. 98% 以 上 的 参数 满足 相对 更 严 苛 的 PSRF < 1.1 
收敛 标准 (Brooks & Gelman, 1998))。 

图 7 分 别 呈 现 了 3 个 模型 的 属性 (模式 ) 判 准 率 。 


图 6 模拟 研究 Q 和 矩阵 (K x D. 空白 为 “0”， 灰色 为 “1”,* 表 示 T= 15 测验 条 件 下 用 题 
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首先 ， 当 交叉 载 符 为 0 时 , 3 个 模型 在 不 同 测验 条 件 
的 表现 基本 一 致 。 其 次 ， 随 着 交叉 载荷 的 提高 ， 可 
发 现 3 个 模型 的 ACCR 和 PCCR 在 不 同 测验 条 件 下 
均 有 所 提升 ， 其 中 C-MCDM-C 提升 幅度 最 大 ， 
C-MCDM-D 次 之 , C-MCDM-0 最 小 。 这 表明 , 在 联 
合 -交叉 负载 建 模 法 中 ,为 提高 诊断 分 类 准确 性 ， 
直接 利用 RT 和 FC 数据 为 被 试 对 属性 的 掌握 情况 
提供 辅助 信息 比 先 为 高 阶 潜在 能 力 提 供 辅助 信息 
再 间接 影响 被 试 对 属性 的 掌握 更 有 效 。 对 此 , 一 种 
可 能 的 原因 是 , ТЕ C-MCDM-0 Ч, HO-DINA 模型 
(RA 数据 的 测量 模型 ) 中 的 高 阶 潜在 能 力作 为 一 种 
辅助 参数 其 参数 估计 返 真 性 通常 较 差 (de la Torre & 
Douglas, 2004; Zhan, 2020; Zhan et al., 2020); 因此 ， 
尽管 利用 RT 和 FC 数据 中 的 辅助 信息 可 以 适当 提 
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这 点 在 图 4 中 也 可 以 得 到 印证 。 
图 8 分 别 呈 现 了 3 个 模型 的 潜在 能 力 、 洪 在 加 


工 速度 和 潜在 视觉 参与 度 的 参数 估计 返 真性 ,首先 ， 
3 个 模型 在 所 有 条 件 的 参数 估计 偏差 都 接近 于 0。 
其 次 ,对 C-MCDM-0 而 言 ， 随 着 交叉 载荷 的 提高 ， 
潜在 能 力 的 RMSE 逐渐 下 降 且 Cor 逐渐 提高 ,表明 
随 着 RT 和 FC 数据 中 的 辅助 信息 的 提高 ,潜在 能 
的 估计 返 真 性 会 随 之 增加 ; 但 值得 注意 的 是 ， 随 着 
交叉 载 千 的 提高 ,尽管 潜 在 能 力 的 估计 返 真 性 有 所 
提升 , 但 潜在 加 工 速 度 和 潜在 视觉 参与 度 的 估计 返 
真性 却 出 现下 降 现 象 。 然 后 ,， 对 C-MCDM-D 和 
C-MCDM-C 而 言 , 由 于 RT 和 FC 数据 并 未 直接 为 
潜在 能 力 提供 辅助 信息 系 ; 因此 ， 随 着 交叉 载 集 的 
提高 ， 两 模型 中 潜在 能 力 的 RMSE Hit fa FI E. Cor 


高 高 阶 潜在 能 力 的 参数 估计 准确 性 , 但 或 许 是 提升 略微 提高 。 
WEAR, 难以 有 效 促进 潜在 属性 的 估计 准确 性 。 由 于 篇 幅 限 制 ,3 个 模型 的 题目 参数 估计 返 真 
(a) C-MLDM-0 (b) C-MLDM-D (c) C-MLDM-C 


EHACCR Al E ACCR A2 ШШ ACCR АЗ 


иш ACCR A4 к=АССЕ AS --PCCR иш ACCR A4 


mm ACCR Al EHACCR A2 SW ACCR АЗ 
ACCR AS — PCCR 


BHACCR А! mACCR А2 EE ACCR АЗ 
mm ACCR A4 maACCR AS -e PCCR 


图 7 模拟 研究 1 中 3 个 C-MCDM 的 属性 (模式 ) 判 准 率 . 
注 : N= 样本 量 ;I= 测验 长 度 ; CL = ZLAR; ACCR = 属性 判 准 率 ; PCCR = 属性 模式 判 准 率 . 


(a) C-MLDM-0 


(b) C-MLDM-D 


(c) C-MLDM-C 


ШШ 0 Bias E т Bias ШШ c Bias EH 0 Bias E т Bias ШШ c Bias ШШ 0 Bias E т Bias ШШ c Bias 
—0RMSE ~~ t RMSE —eRMSE — 0 RMSE 一 TRMSE — s RMSE — 0 RMSE 一 TRMSE — s RMSE 
* 0 Cor 9 «c Cor * 8 Cor * 0 Cor 9 т Cor * ¢Cor * 0 Cor € t Cor * g Cor 


图 8 模拟 研究 1 中 3 个 C-MCDM 的 潜在 能 


、 湾 在 加 工 速度 和 潜在 视 党 参与 度 的 参数 估计 返 真 性 . 
注 :N = 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ;060= 高 阶 潜在 能 力 ;t= 潜在 加 工 速 度 ; = = 
325: RMSE = 均 方 根 误差 : Сог = 估计 值 与 真 值 的 相关 系数 . 


潜在 视觉 参与 度 ; Bias = fW 
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性 呈现 在 网 络 版 附录 表 S2-S4 中 。 整 体 而 言 ， 在 不 
同 测验 条 件 下 ，3 个 模型 的 题目 参数 估计 返 真 性 都 
较 好 ， 呈 现 出 较为 一 致 的 趋势 : 被 试 数量 增加 有 助 
于 提高 题目 参数 估计 返 真 性 ， 而 测验 长 度 和 交叉 载 
向 大 小 的 影响 似乎 很 小 。 
4.2 ”模拟 研究 2 
4.21 数据 生成 与 分 析 

为 进一步 探究 新 模型 的 相对 优势 及 交叉 -负载 
的 必要 性 , 模拟 研究 2 中 分 别 使 用 3 个 新 模型 和 
H-MCDM 作为 数据 生成 模型 ， 然 后 对 比 探究 几 个 
模型 的 表现 。 当 3 个 新 模型 作为 数据 生成 模型 时 ， 
被 试 的 潜在 能 力 、 洪 在 加 工 速 度 和 潜在 视觉 参与 度 
的 生成 方法 与 模拟 研究 1 保持 一 致 (公式 12); 交叉 
载荷 CL (М = -gi) 从 均值 为 0.1、 标 准 差 为 0.3 的 正 
态 分 布 中 抽取 ,表明 交叉 载 答 在 题目 之 间 存 在 差异 
(该 设 定 参考 了 上 文 实 证 数据 的 结果 )。 当 H-MCDM 
作为 数据 生成 模型 时 ,被 试 的 潜在 能 力 、 潜 在 加 工 
速度 和 潜在 视觉 参与 度 按 如 下 分 布 生成 : 


0, 0 1 
t, -MVN||0|, |-025 025 (14) 
e, 0) (025 -0.125 025 


此 时 , Por = —0.5, ре = 0.5 Жр, = -0.5， 该 设 定 参考 
了 已 有 实证 数据 的 结果 (Zhan，Jiao,， & Liao, 2018; 
Man & Harring, 2019): 假设 学 生 能 力 越 高 则 加 工 
速度 越 慢 且 视 觉 参与 度 水 平 越 高 ; 同时 , 学 生 学 习 
能 力 越 低 则 加 工 速度 越 快 且 视 觉 参与 度 水 平 越 低 。 
另外 ,每 种 模拟 条 件 下 均 固 定 被 试 量 N = 500 和 测 
Tre BE T= 30, 其 他 设 定 均 与 模拟 人 研究 1 保持 一 致 。 
每 种 模拟 条 件 下 生成 30 组 数据 。 

当 3 个 新 模型 作为 数据 生成 模型 时 ， 仅 使 用 数 
据 生成 模型 和 H-MCDM 分 析 数 据 ; 当 H-MCDM (Е 


表 7 模拟 研究 2 中 潜在 属性 (模式 ) 判 准 率 . 


数据 生成 模型 


Al 

H-MCDM 0.957 
C-MCDM-0 

C-MCDM-0 0.961 

H-MCDM 0.953 
C-MCDM-D 

C-MCDM-D 0.960 

H-MCDM 0.955 
C-MCDM-C 

C-MCDM-C 0.991 

H-MCDM 0.960 

C-MCDM-0 0.960 
H-MCDM 

C-MCDM-D 0.957 

С-МСЮМ-С 0.957 


詹 沛 达 : 引入 眼 动 注视 点 的 联合 -交叉 负载 多 模 态 认 知 诊断 建 模 
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为 数据 生成 模型 时 ,使 用 H-MCDM 和 3 个 新 模型 
分 析 数 据 。 参 数 估 计 设 定 ( 如 ， 链 数 和 链 长 等 )、 收 
敛 指标 和 返 真 性 指标 等 均 与 模拟 研究 1 保持 一 致 。 
42.2 AR 

表 6 呈 现 不 同 条 件 下 各 数据 分 析 模 型 与 数据 的 
拟 合 情 况 。 首 先 , 无 论 何 种 条 件 下 ,数据 生成 模型 
本 和 号 对 模拟 数据 的 拟 合 均 相 对 更 好 。 其 次 ,根据 
DIC 可 发 现 ， 当 C-MCDM 作为 数据 生成 模型 时 , C- 
MCDM 较 H-MCDM 的 相对 优势 较 大 ; 而 当 H-MCDM 
作为 数据 生成 模式 时 ,， H-MCDM ££ C-MCDM 的 相 
对 劣势 较 小 ; 表明 C-MCDM 对 不 同 测验 条 件 的 兼 
REHE H-MCDM 更 好 。 即 忽略 可 能 存在 的 交 又 负 
载 所 导致 的 模型 -数据 不 拟 合 比 匈 余 考虑 存在 交叉 
负载 所 导致 的 模型 -数据 不 拟 合 的 程度 更 大 。 表 7 
呈现 了 不 同 条 件 下 各 数据 分 析 模 型 的 属性 判 准 率 。 
结果 的 整体 趋势 与 DIC 的 类 似 ， 即 忽略 可 能 存在 的 
交叉 负载 对 PCCR 的 负面 影响 比 宛 余 考 虑 存在 交叉 
负载 对 PCCR 的 负面 影响 更 大 。 另 外 , 洪 变 量 的 和 
题目 参数 的 返 真 性 也 均 呈 现 类 似 的 趋势 ( 见 网 络 版 


表 6 模拟 研究 2 中 模型 -数据 拟 合 情 况 


数据 生成 模型 数据 分 析 模 型 DIC 
H-MCDM 186481.5 
C-MCDM-0 
C-MCDM-0 181029.5 
H-MCDM 183774.8 
C-MCDM-D 
C-MCDM-D 181720.3 
H-MCDM 189775.6 
C-MCDM-C 
C-MCDM-C 183881.5 
H-MCDM 180286.2 
C-MCDM-0 180395.0 
H-MCDM 
C-MCDM-D 180347.8 
C-MCDM-C 180351.9 
ACCR 
PCCR 
A2 A3 A4 А5 
0.966 0.967 0.975 0.977 0.862 
0.969 0.969 0.977 0.979 0.874 
0.966 0.966 0.971 0.982 0.860 
0.970 0.984 0.980 0.987 0.894 
0.961 0.969 0.970 0.980 0.858 
0.990 0.988 0.990 0.995 0.958 
0.958 0.967 0.977 0.977 0.863 
0.957 0.967 0.977 0.977 0.863 
0.958 0.967 0.977 0.976 0.861 
0.957 0.966 0.976 0.976 0.859 
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附录 表 S5-S6)。 总 之 , 模拟 研究 2 结果 表明 忽略 可 
能 存在 的 交 又 负载 所 导致 的 负面 结果 比 宛 余 考 虑 
存在 交叉 负载 所 导致 的 更 严重 ， 即 C-MCDM 对 测 
验 情境 的 兼容 性 优 于 H-MCDM 的 。 


5 总 结 与 展望 
5.1 总 结 

个 体 的 问题 解决 行为 是 彼此 相关 的 多 种 认 知 
过 程 及 心理 建构 所 共同 决定 的 。 在 技术 增强 测评 环 
境 中 ,通过 多 种 仪器 或 测量 设备 采集 的 多 模 态 数据 
为 实现 对 个 体 认 知 结 构 的 精准 诊断 及 其 他 认 知 特 
征 的 全 面 反馈 提供 了 可 能 性 。 本 文 以 对 RA 数据 、 
RT 数据 和 FC 数据 的 分 析 为 例 ,基于 联合 -交叉 负 
载 建 模 法 提出 了 3 个 具有 不 同 理论 假设 的 C-MCDM。 
其 中 , C-MCDM-0 假设 被 试 的 潜在 能 力 的 变化 会 影 
响 其 完成 该 题目 的 耗 时 和 所 用 注视 点 数 ; 而 C- 
MCDM-D 和 C-MCDM-C 均 假设 被 试 的 潜在 属性 掌 
握 情 况 会 影响 其 完成 该 题目 的 耗 时 和 所 用 注视 点 
数 ， 两 者 差异 在 于 前 者 认为 仅 有 被 试 掌握 了 题目 所 
考查 的 所 有 属性 后 才 会 影响 RT 和 FC， 而 后 者 认 为 
被 试 掌握 该 题目 所 考查 的 属性 的 数量 会 影响 RT 和 
FC。 然 后 , 本 文 以 一 则 实证 数据 为 例 对 比 探究 了 5 
个 MCDM 的 表现 , 包括 基于 传统 分 离 建 模 法 的 
S-MCDM 基于 联合 -层级 建 模 法 的 H-MCDM 和 新 
提出 的 3 个 C-MCDM。 实 证 研究 结果 表明 (1) 联 合 
分 析 ( 即 H-MCDM 和 C-MCDM) 比 分 离 分 析 ( 即 S- 
MCDM) 更 适用 于 提供 平行 信息 的 多 模 态 数据 ; Н. 
(2) 从 模型 -数据 拟 合 角度 看 ， 新 模型 比 H-MCDM 
更 拟 合 该 数据 。 此 外 , 实证 研究 也 向 读者 展示 了 如 
何 根据 数据 分 析 结 果 来 实现 对 个 体 认 知 结构 的 诊 
Dip Be A Ae iE САП, DAS ET е, 使 
用 两 则 模拟 研究 进一步 探讨 新 模型 的 表现 。 模 拟 研 
究 1 作为 对 实证 研究 的 补充 , 探究 了 3 个 新 模型 在 
不 同 模拟 测验 条 件 的 参数 估计 返 真 性 。 模 拟 研究 2 
对 比 探讨 了 3 个 新 模型 和 H-MCDM 的 表现 ， 以 展 
示 新 模型 的 相对 优势 及 考虑 交叉 负载 的 必要 性 。 模 
拟人 研究 1 结果 表明 (1) 全 贝 叶 斯 MCMC 算法 能 够 为 
3 个 新 模型 提供 较 好 的 参数 估计 返 真 性 , 且 3 个 新 
模型 中 各 参数 估计 均 可 有 效 收 敛 ; (2) 实 践 应 用 中 ， 
充足 的 题目 数量 是 保证 被 试 参数 估计 准确 性 的 必 
要 条 件 之 一 ; (3) 在 不 以 题库 建设 为 目标 的 (或 其 他 
题目 参数 相对 不 重要 的 ) 应 用 场景 中 ,100 人 的 小 样 
本 量 足 以 满足 提供 较为 精准 的 被 试 参 数 估计 值 。 模 
拟 研 究 2 结果 表明 忽略 可 能 存在 的 交叉 负载 所 导致 
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的 负面 结果 比 元 余 考 虑 存在 交叉 负载 所 导致 的 更 
E, B C-MCDM 对 测验 情境 的 兼容 性 优 于 H- 
MCDM 的 。 总 之 , 本 文通 过 实证 研究 前 明了 新 模型 
的 现实 可 应 用 性 ,并 通过 模拟 研究 前 明了 新 模型 具 
有 和 良好 的 心理 计量 学 性 能 。 

综 上 所 述 ， 对 本 文 的 理论 创新 、 理 论 贡 献 和 应 
用 价值 做 如 下 总 结 : 

(1) 理 论 创新 : 首次 将 联合 -交叉 负载 建 模 法 引 
入 认 知 诊断 领域 ， 提 出 3 种 不 同 假设 的 C-MCDM; 

(2) 理 论 贡 献 : 填补 了 在 认 知 诊断 领域 缺少 联 
合 - 交 又 负载 模型 的 空 日 ; 

(3) 应 用 价值 : 从 全 面 反 馈 视 角 出 发 ， 以 认 知 风 
格 和 认 知 流畅 性 为 例 ， 尝 试 在 认 知 诊断 中 提供 认 知 
结构 以 外 其 他 认 知 特征 的 反馈 ; 丰富 了 认 知 诊断 反 
人 馈 的 范围 ,增加 了 认 知 诊断 的 实践 价值 。 

另外 , 本 文 遵循 Zhan 等 (2022) 的 做 法 , 将 实验 
心理 学 与 心理 与 教育 测量 相 结 合 ,， 尝试 将 眼 动 数据 
引入 心理 计量 模型 ; 这 在 一 定 程 度 上 拓展 了 心理 与 
教育 测量 的 研究 范式 ， 为 今后 进一步 将 实验 心理 学 
基于 仪器 的 测量 或 量化 研究 方法 引入 传统 心理 与 
教育 测量 中 提供 了 新 视角 。 

值得 强调 的 是 由 于 新 提出 的 3 个 C-MCDM 与 
H-MCDM 是 基于 不 同 联合 建 模 方 法 构建 的 ， 即 它 
们 基于 不 同 的 理论 假设 。 在 本 文中 , 尽管 3 个 
C-MCDM 对 实证 数据 的 拟 合 程度 优 于 H-MCDM, 
这 并 不 代表 它们 三 者 在 任何 测验 情境 下 都 优 于 
H-MCDM; 比如 ，H-MCDM 的 相对 优势 是 理论 结 
构 简 单 、 待 估计 参数 数量 较 少 。 因 此 , 本文 更 多 的 
是 在 认 知 诊断 领域 品读 者 提供 一 种 基于 联合 -交叉 
负载 建 模 法 的 多 模 态 数据 分 析 视 角 和 方法 ， 以 期 进 
一 步 丰 富 多 模 态 诊断 数据 分 析 模 型 的 可 选项 。 我们 
建议 后 续 使 用 者 针对 特定 的 实证 数据 ， 同 时 使 用 多 
个 MCDM 对 数据 进行 联合 分 析 , 并 基于 数据 -模型 
拟 合 指标 来 选择 相对 最 合适 的 模型 ， 并 结合 模型 的 
构建 理论 对 分 析 结 果 做 进一步 解读 。 
52 局限 与 展望 

本 文 仍 有 一 些 局 限 性 , 值得 后 续 做 进一步 探究 。 
第 一 , 与 已 有 联合 分 析 RA 数据 和 RT 数据 的 研究 
TH EE, 尽管 本 文 仅 额 外 分 析 了 一 种 眼 动 数据 一 一 注 
视点 数 (FC), 但 鉴于 联合 -层级 建 模 法 和 联合 -交叉 
负载 建 模 法 的 灵活 扩展 性 ， 其 他 类 型 的 眼 动 数 据 或 
其 他 模 态 数据 (如 ， 脑 电 [Jeon et al., 2021]) 也 可 尝试 
被 纳入 分 析 中 , 进而 提出 更 全 面 的 可 联合 分 析 更 多 
模 态 数据 的 认 知 诊断 模型 。 
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第 二 , 本 文 以 3 个 代表 性 的 测量 模型 ( 即 HO- 
DINA 模型 、LRT 模型 和 NBF 模型 ) 为 例 阐述 了 联 
合 -交叉 负载 认 知 诊断 模型 的 构建 。 同 样 ， 鉴 于 联 
合 -交叉 负载 建 模 法 的 灵活 扩展 性 ， 后 续 针 对 不 同 
的 测验 情境 可 分 别 替 换 不 同 的 测量 模型 。 当 然 ， 需 
要 强调 的 是 测量 模型 的 更 换 并 不 影响 本 文 的 主要 
创新 点 一 一 联合 -交叉 负载 认 知 诊断 建 模 法 。 

=, WA Zhan 等 (2022), 利用 多 模 态 诊断 数 
据 本 文 只 关注 到 对 有 限 认 知 特 征 的 推 亲 ， 如 沉思 型 
-冲动 型 认 知 风格 、 聚 焦 者 认 知 风格 和 认 知 流畅 性 。 
实际 上 , 个 体 的 认 知 特征 还 有 很 多 , 仅 认 知 风 格 就 
还 有 其 他 的 分 类 方式 ， 比 如 场 独立 性 - 场 依 存 性 、 
言语 型 -视觉 型 等 ; 从 全 面 反 馈 的 视角 看 ,未 来 是 
否 有 可 能 利用 多 模 态 的 数据 实现 对 更 多 认 知 特征 
的 推断 ,， 甚至 对 是 一 些 非 认 知 因素 (如 , 动机、 情绪 
和 信念 ) 的 识别 , 是 非常 值得 关注 的 研究 方 癌 。 

第 四 , 本 文 主要 是 提供 了 一 种 多 模 态 诊断 数据 
的 分 析 方 法 ,实际 上 ， 对 多 模 态 数据 的 利用 可 以 延 
伸 到 很 多 已 有 模型 中 。 比 如 ， 后 续 研 究 可 以 将 多 模 
态 数据 引入 多 策略 CDM (Ma & Guo, 2019) ЖО 
CDM (Wang & Qiu, 2019) 和 多 级 评分 CDM (Ma & 
de la Torre，2016) 中 ,甚至 考虑 将 多 模 态 数据 引入 
到 一 些 非 参 数 诊断 法 中 (如 ， 聚 类 分 析 ) 等 。 

第 五 ， 本 文 提 出 的 3 个 C-MCDM 均 未 考虑 潜 
在 加 工 速度 和 潜在 视觉 参与 度 对 RA 的 影响 ， 即 未 
考虑 利用 RA 数据 信息 提高 这 两 个 潜在 变量 的 参数 
估计 精度 。 后 续 , 和 若 有 必要 也 可 学 试 C-MCDM 做 
进一步 拓 广 , 纳入 上 述 未 考虑 的 路 径 ( 郑 天 朋 等 ， 
in press)， 开 发 全 交 义 负载 模型 ; 只 不 过 要 额外 注 
意 模 型 可 识别 性 问题 。 

第 六 ， 如 2.3.4 市 中 所 述 ， 由 于 在 RT 和 FC 测 
量 模 型 中 的 被 试 参 数 为 连续 变量 ,无 法 像 对 潜在 属 
性 的 诊断 一 样 直接 对 个 体 的 潜在 加 工 速度 和 潜在 
视觉 参与 度 进行 分 类 ， 进 而 无 法 直接 实现 对 个 体 认 
知 特征 的 分 类 。 对 此 , 本 文采 用 了 以 均值 为 切 点 的 
分 类 方法 , 并 依据 潜在 能 力 、 洪 在 加 工 速 度 和 洪 在 
视觉 参与 度 的 分 类 组 合 ， 尝 试 对 个 体 认 知 特征 的 推 
呆 。 需 要 强调 的 是 (1) 这 种 分 类 方法 是 比较 粗糙 的 ， 
适用 于 对 个 体 认 知 特征 的 粗略 推 新 ， 并 非 精 确 的 测 
量 或 诊断 结果 ; (2) 这 种 分 类 方法 所 利用 的 信息 尚 有 
BS, 仅 利 用 了 潜在 能 力 、 洪 在 加 工 速 度 和 潜在 视觉 
参与 度 这 3 个 潜在 变量 的 估计 值 作 分 类 依据 。 未 来 ， 
为 实现 对 个 体 认 知 特征 的 更 精准 推断 甚至 是 测量 ， 
可 尝试 从 3 个 角度 突破 : (1) 综 合 利 用 更 多 模 态 的 数 
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据 来 实现 对 个 体 认 知 特征 的 推断 ， 以 期 为 推断 性 分 
类 提供 更 多 的 参考 信息 ; (2) 尝 试 借鉴 计算 机 化 分 类 
测验 中 对 连续 变量 的 分 类 方法 (Ferguson, 1969), VW 
期 改进 以 均值 为 切 点 的 分 类 方法 ; C2) 直 接 通过 类 别 
变量 构建 特定 认 知 特征 的 被 试 参数 (Wang & Chen, 
2020)， 以 期 实现 对 个 体 认 知 特征 的 测量 而 非 推 断 。 

BE, 由 于 现实 硬件 条 件 的 限制 (如 , 没有 大 
批量 眼 动 仪 )， 本文 所 分 析 的 实证 数据 仍 属 于 小 规 
模 测 验 (由 于 成 本 仪 硕 成 本 原因 ,在 未 来 一 段 时 间 ， 
涉及 实验 仪器 采集 数据 的 研究 都 会 受 限于 被 试 量 
的 问题 )。 尽管 模拟 研究 结果 显示 ,在 不 考虑 建立 题 
库 的 应 用 场景 下 小 样本 量 (100 人 ) 也 可 以 满足 要 求 ， 
但 在 大 规模 测验 和 涉及 题库 的 应 用 场景 (如 ,计算 
机 化 自 适应 测验 ) 中 ,这 些 硬件 条 件 的 限制 都 会 制 
约 多 模 态 数据 分 析 方 法 的 实际 应 用 。 随 着 测量 方式 
及 数据 分 析 技 术 的 不 断 发 展 ， 充 分 利用 计算 机 (网 
WER, 尤其 是 人 工 智 能 的 介入 ,并 结合 便携 式 
和 低 成 本 的 心理 学 实验 仪器 ,我 们 期 待 也 有 理由 相 
信 未 来 可 以 突破 硬件 条 件 的 限制 , 在 大 规模 测验 中 
实现 对 多 模 态 数据 的 采集 与 分 析 。 

最 后 ,在 贝 叶 斯 参数 估计 值 中 ， 先 验 分 布 的 选 
择 反映 了 数据 分 析 者 对 模型 参数 的 信念 或 已 有 经 
验 。 根据 已 有 数据 分 析 经 验 以 及 已 有 人 研究 结果 (Man 
& Harring, 2019; Zhan et al., 2022)， 本 文选 取 了 特 
定 的 先 验 分 布 。 尽管 鲁 棱 性 分 析 表 明 模 型 的 参数 估 
计 结 果 受 包含 不 同 信息 量 的 先 验 分 布 的 影响 较 小 ， 
但 这 并 不 意味 者 本 文 所 用 的 先 验 分 布 适用 于 所 有 
测验 情境 。 在 后 续 的 实践 应 用 中 , 针对 全 新 的 实证 
数据 ， 数 据 分 析 者 也 可 尝试 使 用 超 先 验 分 布 来 探索 
恰当 的 先 验 分 布 。 
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Joint-cross-loading multimodal cognitive diagnostic modeling 
incorporating visual fixation counts 
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Abstract 


Students’ observed behavior (e.g., learning behavior and problem-solving behavior) comprises of activities 


that represent complicated cognitive processes and latent conceptions that are frequently systematically related 


to one another. Cognitive characteristics such as cognitive styles and fluency may differ between students with 


the same cognitive/knowledge structure. However, practically all cognitive diagnosis models (CDMs) that merely 


assess item response accuracy (RA) data are currently incapable of estimating or inferring individual differences 


in cognitive traits. With advances in technology-enhanced assessments, it is now possible to capture multimodal 


data, such as outcome data (e.g., response accuracy), process data (e.g., response times (RTs), and biometric data 


(e.g., visual fixation counts (FCs)), automatically and simultaneously during the problem-solving activity. 


Multimodal data allows for precise cognitive structure diagnosis as well as comprehensive feedback on various 


cognitive characteristics. 


First, using joint analysis of RA, RT, and FC data as an example, this study elaborated three multimodal 


1432 心 理 ee 报 第 54 Ж 


data analysis methods and models, including separate modeling (whose model is denoted as S-MCDM ), joint- 
hierarchical modeling (whose model is denoted as H-MCDM) (Zhan et al., 2022), and joint-cross-loading 
modeling (whose model is denoted as C-MCDM ). Following that, three C-MCDMs with distinct hypotheses 
were presented based on joint-cross-loading modeling, namely, ће C-MCDM-0, C-MCDM-D, and C-MCDM-C, 
respectively. Three C-MCDMs, in comparison to the H-MCDM, introduce two item-level weight parameters (1.е., 
o; and А;) into the RT and FC measurement models, respectively, to quantify the impact of latent ability or latent 
attributes on RT and FC. The Markov Chain Monte Carlo method was used to estimate model parameters using a 
full Bayesian approach. To illustrate the three proposed models’ application and compare them to the S-MCDM 
and H-MCDM, multimodal data for a real-world mathematics test was used. Data was gathered at a prominent 
university on the East Coast of the United States in an eye-tracking lab. An Z = 10 mathematics items test was 
given to N = 93 university students with normal or corrected vision. The test included K = 4 attributes, and the 
related Q-matrix is shown in Figure 3. The data is divided into three modalities: RA, RT, and FC, which were all 
collected at the same time. The data was fitted to all five multimodal models. 

In addition, two simulation studies were conducted further to explore the psychometric performance of the 
proposed models. The purpose of simulation study 1 was to explore whether the parameter estimates of the 
proposed models can converge effectively and explore the recovery of parameter estimation under different 
simulated test situations. The purpose of simulation study 2 was to explore the relative merits of C-MCDMs and 
H-MCDM, that is, to explore the necessity of considering cross-loading in multimodal data analysis. 

The results of the empirical study showed that (1) the C- MCDM-0 has the best model-data fitting, followed 
by the H-MCDM and the S-MCDM. Although the DIC showed that the C- MCDM-D and C-MCDM.-C also fitted 
the data well, the results were only for reference because some parameter estimates in these two models did not 
converge; that (2) the correlation coefficients between latent ability and latent processing speed and that between 
latent ability and latent concentration were weak, making it difficult to fully exploit the theoretical advantages of 
H-MCDM over S-MCDM (Ranger, 2013). By contrast, since the C-MCDM-0 can directly utilize the information 
from RT and FC data, the standard error of the estimates of its latent ability was significantly lower than that of 
the previous two competing models; and that (3) the median of the estimates of @; was less than 0, which indicated 
that for most items, the higher the participant's latent ability 15, the longer the time it will take to solve the items; 
and the median of the estimates of A; was higher than 0, which indicated that for most items, the higher the 
participant's latent ability 1s, the more number of fixation counts he/she shown in problem-solving. Furthermore, 
it should be noted that the estimates of o; and А; do not always have the same sign for different items, indicating 
that the influence of latent abilities on RT and FC has different directions (1.e., facilitation or inhibition) for 
different items. Furthermore, simulation study 1 indicated that the parameter estimation of the proposed three 
models could converge effectively and the recovery of model parameters was good under different simulated test 
situations. The results of simulation study 2 indicated that the adverse effects of ignoring the possible cross- 
loadings are more severe than redundantly considering the cross-loadings. 

Overall, the results of this study indicate that (1) fusion analysis 1s more suitable for multimodal data that 
provides parallel information than separate analysis; that (2) through cross-loading, the proposed models can 
directly use information from RT and FC data to improve the parameter estimation accuracy of latent ability or 
latent attributes; that (3) the results of the proposed models can be used to diagnose cognitive structure and infer 
other cognitive characteristics such as cognitive styles and fluency; and that (4) the proposed models have better 
compatibility with different test situations than H-MCDM. 

Keywords cognitive diagnosis, multimodal data, item response times, fixation counts, cognitive style, eye-tracking 
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51 参数 佰 计 对 先 验 分 布 的 鲁 棒 性 
分 析 
S1.1 高 、 中 和 低 信息 先 验 分 布 
S1.1.1 中 信息 先 验 分 布 
在 贝 叶 斯 参数 估计 值 中 ， 先 验 分 布 的 选择 反映 
了 数据 分 析 者 对 模型 参数 的 信念 或 已 有 经 验 。 根据 
已 有 数据 分 析 经 验 以 及 已 有 研究 结果 (如 ，Man & 
Harring, 2019; Zhan et al., 2022), 包含 适量 信息 的 
先 验 分 布 ( 即 中 信息 先 验 分 布 ) 设 定 如 下 (对 3 个 
C-MCDM 通用 ): 
首先 , 根据 局 部 独立 性 假设 ， 有 
Y ~ Bernoulli( P(Y,, = 1)), 
log(T,) ~ NG ^ ,, 02), 
V, ~ NB(exp(e, + т,), d;^), 
a, ~ Bernoulli(P(a,, = 1)). 
其 次 ,对 题目 参数 而 言 ， 有 
5, ~ Веіа(1,1), g, ~ Веіа(1,1) Ке, <1—s,), 
& ~ МА, 2), о, ~ ү InvGamma(,1), 
т, ~ N(4, 2), h, ~ ІпуСатта(1, 1), 
Ф, ~ №(0, 0.5), А, ~ N(0,0.5). 
然后 ， 对 被 试 参 数 而 言 ， 有 
Ө, ~ N(0, T), 


t, 0 
ds MVN ? Ў eison ? 
E, 0 
| 1 0 
i ~ InvWishart „2 | 
person 0 1 


再 有 ， 对 高 阶 潜在 结构 参数 而 言 有 
ү, ~ N(0,2), y, ~ №(1.5,2) КҮ, > 0). 

S1.1.2” 低 信息 先 验 分 布 

低 信 息 先 验 分 布 的 设 定 以 “无 知 ? 为 前 提 ， 并 以 
大 方差 (如 , 10) 为 变异 范围 。 在 51.1.1 的 基础 上 ， 低 
信息 先 验 分 布设 定 如 下 : 

5, ~ Веіа(1,1), g; ~ Beta(1, 1) (g; <1—5,), 

E, ~ N(0,10) I(E, > 0), о, ~ JInvGamma(, 10), 


т, ~ N(0,10) I(m, > 0), А ~ InvGamma(1, 10), 


Ф, ~ №(0,10),А, ~ N(0,10), 

ү, ~ (0,10), y, ~ №(0,10) I(y, > 0). 
其 他 参数 的 先 验 分 布 保持 不 变 。 
S1.1.3 ”高 信息 先 验 分 布 

高 信息 先 验 分 布 的 设 定 以 “先知 ”为 前 提 ， 围 绕 
参数 “ 真 值 ”进行 ， 并 以 小 方差 (如 , 0.5) 为 变异 范围 。 
在 S1.1.1 的 基础 上 , 高 信息 先 验 分 布设 定 如 下 : 

5, ~ Beta(1,10), g, ~ Beta(1,10) е, <1—s,), 

é, ~ N(4,0.5), ө, ~ JU(L5, 4), 

т, ~ N(4, 0.5), h, ~ InvGamma(2, 6), 

Фф, ~ N(-0.5, 0.5),A, ~ N(0.5, 0.5), 

yı ~ N(0,1), y, ~ N(1.5, 0.1) ү, > 0). 

其 他 参数 的 先 验 分 布 保持 不 变 。 
S1.2 ”参数 估计 一 致 性 

选用 正文 模拟 研究 中 N= 100,7 = 15, CL = 0.5 
条 件 下 生成 的 数据 作为 分 析 数 据 ; 该 模拟 测验 条 件 
属于 小 样本 短 测 验 情 境 ， 理 论 上 , 参数 估计 结果 受 
到 先 验 分 布 的 影响 更 大 。 因 此 ， 随 样本 量 增 大 及 测 
验 长 度 提 高 ,参数 估计 结果 受 先 验 分 布 中 所 含 信息 
量 的 影响 会 逐渐 降低 ( 即 鲁 棒 性 会 增加 )。3 个 模型 
的 参数 估计 设 定 (如 ,马尔 可 夫 链 长 ) 与 模拟 研究 中 
保持 一 致 。 

图 S1-S2 和 表 51 SIERT 3 个 模型 在 不 同 
言 息 量 先 验 分 布下 各 参数 的 返 真 性 。 可 发 现 随 着 先 
验 分 布 的 信息 量 的 提高 ， 各 参数 的 返 真 性 均 有 小 幅 
度 提 升 ; 其 中 ,提升 幅度 相对 较 大 的 是 由 低 信 息 量 
先 验 到 中 信息 量 先 验 时 ， 而 由 中 信息 量 先 验 到 高 信 
息 量 先 验 的 提升 幅度 微弱 。 考虑 到 实际 应 用 中 很 少 
使 用 如 此 低 信息 的 先 验 分 布 且 无 法 像 高 信息 先 验 
分 布 那 样 围绕 各 参数 的 “ 真 值 ” 进 行 设 定 ， 中 信息 先 
验 分 布 的 普 适 性 是 相对 较 高 的 : 即 避免 了 不 实际 的 
“无 知 " 或 “先知 ”同时 又 保证 了 较 高 的 参数 估计 精 
度 。 因 此 , 正文 中 我 们 选用 中 信息 先 验 分 布 进行 后 
续 的 分 析 。 

整体 而 言 ， 当 采用 包含 不 同 信息 量 的 先 验 分 布 
时 ,每 个 模型 的 参数 估计 结果 均 较 为 稳定 ， 即 新 模 
型 对 不 同 先 验 分 布 具有 一 定 的 鲁 棒 性 。 
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图 S1 三 模型 在 不 同 信 息 量 先 验 分 布下 的 
属性 (模式 ) 判 准 率 . 
注 : N= 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ; ACCR = 属性 
判 准 率 ; PCCR = 属性 模式 判 准 率 . 
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图 52 三 模型 在 不 同 信息 量 先 验 分 布下 的 潜在 能 
潜在 加 工 速 度 和 潜在 视觉 参与 度 的 返 真性 

TE: М = 样本 量 ; I = 测验 长 度 ; CL = 交叉 载荷 ; 0 = 高 阶 潜在 

能 力 ; v = 潜在 加 工 速度 ; є = 潜在 视觉 参与 度 ; Bias = 偏差 ; 

RMSE = 均 方 根 误 差 ; Cor = 估计 值 与 真 值 的 相关 系数 . 
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S2 MCDM 参数 估计 JAGS 代码 


# 篇 幅 限 制 ,， 仅 呈现 C-MLDM-C 的 JAGS 代码 

# 对 C-MCDM-0 而 言 ， 仅 需 将 RT 和 FC 测量 模型 中 的 inprod(attribute[n,], Q[Ii]) 蔡 换 为 theta[n,i] 即 可 
# 对 C-MCDM-D йт, (х ВТ 和 FC 测量 模型 中 的 inprod(attribute[n,], Q[i]) 蔡 换 为 prod(w[n,i, ]) Bl nT 
model 


for (n in 1:3) { 
for (i in 1:1) { 

Score[n, i] ~ dbern(prob[n,i]) ZScore 题目 作答 精度 
for(k in I:K) (w[n,i,k]--pow(attribute[n,k], Q[i,k])} Zattribute /& E; Q 4B RE 
prob[n,i]<-guess[i]+(1-slip[i]-guess[i])*prod(w[n,i,]) guess 猜测 参数 ; slip 失误 参数 
FC[n,i] ~ dnegbin(p[n,i], h[i]) «FC 注视 点 数 
p[n.i] <- h[1]/(h[i]* mu[n,i]) 
mu[n,i] <- exp(m[i]+lamda[i]*inprod(attribute[n,], Q[i,])+epsilon[n]) # m 视觉 强度 参数 ; lamda 26 X Жү; epsilon 潜在 


logT[n, i] ~ dnorm(mu logt[n,i], den omega[i]) £logT 对 数 题目 作答 时 间 
mu logt[n,i] <- zeta[i]-(tau[n]+phi[i]*inprod(attribute[n, ],Q[i,])) # zeta 时 间 强 度 参数 ; tau 潜在 加 工 速度 ; phi 交叉 载荷 
"i in 1:N){ 
for(k in 1:K)1 
logit(att_prob[n,k])<-gammal [k]*theta[n]-gamma0[k] #gammal 属性 区 分 度 ; gamma0 JE ERIE; theta 高 阶 潜在 能 力 
attribute[n,k]-dbern(att prob[n,k]) 


H 
for (n in 1:3) { 
theta[n] ~ dnorm(0,1) 
person parameter[n, 1:2] ~ dmnorm(person mu[1:2], prec.theta[1:2, 1:2]) 
tau[n] <- person parameter[n, 1] 
epsilon[n] «- person parameter[n ,2] 
j 
for (i in 1:1) { 
slip[i]~dbeta(1,1) 
guess[i]~dbeta(1,1) T(,1-slip[1]) 
zeta[i]~dnorm(4,0.5) 
m[i]-dnorm(4,0.5) 
h[1] <- I/prec.h[i] 
v[1] <- mean(mu[.1])*(1/h[1]) *pow(mean(mu[,1]),2) 
d[i] <- 1/sqrt(v[i]) #d 时 间 区 分 度 参 数 
den omega[i] ~ dgamma(1, 1) 
omega[i] <- sqrt(den omega[i]) #omega 时 间 精 度 参数 
prec.h[i] ~ dgamma(1,1) 
phi[i]~ dnorm(0, 2) 
lamda[i]-dnorm(0, 2) 


j 

for(k in 1:K)1 
gammaO[k ]-dnorm(0,0.5) 
gammal [k]-dnorm(1.5,0.5) T(0,) 


person mu[l] <- 0 

person mu[2] <- 0 

КІ, 1] <- 1 

R[1, 2] <- 0 

R[2, 1] <- 0 

R[2, 2] <- 1 

prec.theta[ 1:2, 1:2]-dwish(R[1:2,1:2],2) 

Sigma person--inverse(prec.theta[1:2, 1:2]) 

r 1 2 <- Sigma person[1,2]/(sqrt(Sigma person[l,1])*sqrt(Sigma person[2,2])) # 1 2 加 工 速度 与 视觉 参与 度 之 间 的 (总 
体 ) 相 关系 数 

} 


